の中断 サイバーセキュリティツールとしての人工知能 Mozillaは、FirefoxにおけるAnthropicとの協業により、大きな前進を遂げました。わずか数週間で、AIモデルはMozillaのオープンソースブラウザに存在する、通常であれば専門の人間による作業で数ヶ月を要する脆弱性を複数発見しました。
この実験は、 スペインおよびヨーロッパのFirefoxユーザーこれは、実際のコードの監査に関して言語モデルが現在どこまで対応できるか、また何億人もの人が毎日使用するソフトウェアを保護する上で言語モデルがどのような役割を果たせるかを測定するのに役立っています。
AIが最高のセキュリティ監査人になるとき
ソフトウェアセキュリティにおいては、攻撃者より先に脆弱性を見つけることが極めて重要です。 何百万人ものユーザーを保護するか、データを公開するかこのような状況において、Mozilla は、研究者やサイバー犯罪者よりも先に、高度な AI にブラウザのソースコードをレビューさせて脆弱性を見つけるという、珍しいアプローチをテストしました。
発売の数週間前に Firefoxの148ブラウザのセキュリティチームは衝撃的なレポートを受け取りました。 アントロピック・フロンティア・レッドチーム 同社の内部攻撃研究グループは、クロードモデルの助けを借りて、 検証可能なセキュリティバグが12件以上 FirefoxのJavaScriptエンジンに脆弱性が見つかりました。これは単なる疑惑ではなく、具体的な証拠に裏付けられたバグでした。
この分野でAIを活用した他の試みと一線を画したのは、報告の質の高さでした。それぞれの脆弱性は、 再現可能な最小限のテストケースこれらは、脆弱性を決定論的に引き起こす可能性のある小さなコードスニペットでした。これにより、Mozilla のエンジニアは数時間以内に問題が実際に存在するかどうかを確認し、曖昧なシナリオを再現する時間を費やすことなくパッチの作成に着手することができました。
自動化ツールによって生成された多くのアラートがゴミ箱行きになってしまうエコシステムでは、 誤検知または不正確な報告Anthropic のアプローチにより、ノイズが大幅に削減され、有用なシグナル (量は少ないが検証済みで実用的な結果) が提供されました。

Anthropic の Frontier Red Team とは何ですか? Claude とはどのように連携しますか?
呼び出し フロンティアレッドチーム これは、攻撃的および防御的セキュリティにおけるAIモデルの限界を探ることに特化したアントロピックの部門です。その目標は、モデル内の内部リスクを評価するだけでなく、 AI をどのように活用して実際のソフトウェアの脆弱性を見つけられるのでしょうか? 悪意のある人物がそれを実行する前に。
この数ヶ月間、このチームは次のようなモデルを示しました。 クロード・オーパス4.6 走れる 制御された環境における複雑なネットワークに対する多段階攻撃これは彼らの分析能力の強さを物語っています。その同じ権限が、責任ある脆弱性開示プロセスの下でFirefoxのようなオープンソースプロジェクトを審査するために、協調的かつ責任ある形で再配分されています。
Mozillaブラウザの場合、AnthropicはClaudeを使ってテスト演習から始めました。 過去の Firefox の脆弱性 (CVE) を再現するモデルが、以前のバージョンのコードに既に記録されている障害パターンを認識できるかどうかを確認しました。結果は良好でしたが、一つだけ注意点がありました。その情報の一部は、モデルのトレーニングデータに含まれている可能性があるのです。
さらに、フロンティアレッドチームは興味深い点に踏み込みました。AIに場所を特定するよう依頼したのです。 Firefoxの現在のバージョンにおける新たな脆弱性つまり、公開データベースや Mozilla の内部追跡システムにまだリストされていないバグです。
FirefoxのJavaScriptエンジンの脆弱性が発見された経緯
出発点はブラウザのJavaScriptエンジンでした。これは、 ウェブページから信頼できない外部コードを実行するこの層でエラーが発生すると、最悪の場合、ユーザーのシステムを攻撃する入り口となる可能性があります。
AnthropicとMozillaが説明しているように、 クロードは約 20 分で最初の重大な脆弱性を発見しました。 分析の最初から、それは失敗だった。 使用-後フリーは、他のシステムの脆弱性と連鎖すると、攻撃者が任意のコンテンツでデータを上書きできる可能性があるメモリ脆弱性のカテゴリです。
アントロピックのエンジニアが最新のブラウザバージョンを搭載した仮想マシンでこの初期アラートを検証している間、AIは並行して作業を続けていました。その間、モデルはすでに 異常な動作を伴う約50件の追加入力それらの多くは後にテストケースとなり、Mozilla に送信されました。
このプロセスはJavaScriptエンジンに限定されませんでした。約2週間かけて、クロードは 約6.000個のC++ファイルと数千の追加プロジェクトファイル112件の報告が生成されました。そのうち、Mozillaセキュリティチームによるトリアージの結果、以下のことが確認されました。 22件の脆弱性がCVEとして登録されました、 そのうちの 14件は重症度が高いと分類されたさらに、影響度が低い、または単なる論理エラーであると考えられる約 90 件の追加の障害も発生しました。
特定されたセキュリティ問題はすべてFirefox 148の開発サイクルで修正されました。このバージョンは、ヨーロッパおよび世界のその他の地域のユーザーにご利用いただけるようになりました。優先度の低いバグも修正されていますが、単一のリリースで変更が過度に多くなることを避けるため、一部の調整は後のバージョンに保留されています。

100以上のバグが検出され、他のAIよりも誤検出が少ない
この共同研究を通して、クロードの分析により、 100種類以上のFirefoxのバグそれらのすべてが悪用可能な脆弱性であることが判明したわけではありませんが、このボリュームは、Mozilla ブラウザのような成熟し監査されたプロジェクトでも、依然として相当数のバグが隠れている可能性があることを示しています。
その影響の大きさを示すために、Mozillaのセキュリティチームは、わずか2週間のテストでAIが 1 年間にブラウザで修正されたすべての重大な脆弱性の約 20% に相当する、重大度の高い欠陥の数を特定します。言い換えれば、AI 支援による監査は、通常は数か月にわたって行われる作業を数日に集中させたのです。
重要な点は誤検知率でした。近年、ヨーロッパを含む多くのオープンソースプロジェクトで誤検知が発生しています。 低品質のAIツールによって生成されたレポートの波これらのレポートは、バグ報奨金プログラムを通じて報酬を得ようとするユーザーから提出されることが多く、存在しない問題や説明が不十分な問題でメンテナーを圧倒してしまいます。
Mozillaはこの状況を認識し、当初は協力に慎重でした。しかし、Frontier Red Teamのアプローチは異なっていました。 確固たる証拠を伴う判決のみが審査のために提出されました。明確な自動再現と、場合によっては AI 自体によって生成され人間によってレビューされた候補パッチ提案が含まれます。
Mozilla のエンジニアは、AI ベースのレポートを信頼するために不可欠だと考える 3 つの要素を強調しました。 最小限のテストケース、詳細な概念実証、および推奨パッチこの組み合わせにより、発見事項が直ちに対応する必要があるか、延期できるかを確認するのに必要な時間が大幅に短縮されます。
AI は発見した脆弱性を悪用できるでしょうか?
実験の最も繊細な点の一つは、クロードが 脆弱性を見つけるそれらを 機能的なエクスプロイトつまり、ターゲットシステム上で悪意のあるアクションを実行できる攻撃です。
アントロピックは、制御された環境でこの能力を測定することを決定しました。チームは、すでにMozillaに報告されている脆弱性に関する情報をモデルに提供し、エクスプロイトコードを生成するよう依頼しました。 ローカルファイルの読み書き テスト マシンでは、実際のシナリオではシステムに重大な危険をもたらすことになるアクションです。
これを達成するために、数百の個別の処刑が実行され、約[不明な金額]が投入されました。 4.000ドルのAPIクレジット結果は微妙なものだった。クロードは 2つの簡単なエクスプロイトが機能するしかし、これはサンドボックスやその他の強化防御など、最新のブラウザに備わっているいくつかの保護機能が意図的に無効にされた環境でのみ発生します。
Mozillaは、現実世界の状況ではFirefoxを侵害するには通常、 複数の脆弱性を連鎖させ、複数の防御層を回避するたとえ重大度の高い脆弱性であっても、1 つの脆弱性が見つかっただけではユーザーのシステムを制御できないことがほとんどであり、そのため、現時点ではこれらのツールの直接的な攻撃能力は制限されています。
それでも、アントロピックは、たとえ少数のケースや限定された条件下であっても、言語モデルが 最新のブラウザのエクスプロイトを自動的に生成する同社は、評価モデルと手法が改善し続けるにつれて、このギャップ(検出と悪用との間の差)は縮まる可能性があると警告している。
MozillaがセキュリティプロトコルにAIを統合
コラボレーションの成功を受けて、 モジラは、AI支援分析を通常のセキュリティワークフローに統合することを確認した。 Firefox向け。財団のチームは既に、バグトリアージ、パッチレビュー、そしてコードの重要な領域における脆弱性パターン検出のために、Claudeを社内で実験的に導入しています。
ヨーロッパに強力なユーザーと開発者を抱えるこの組織は、この技術を プライバシーとセキュリティ保護を強化するこれらはFirefoxプロジェクトのアイデンティティを形成する柱です。オープンソースブラウザであるFirefoxのコードベースは、独立した研究者やAnthropic独自のAIなどの自動エージェントによる監査に利用可能です。
Mozillaにとって鍵となるのは、 自動化と人間によるレビューのバランスAIモデルはバグ検出を加速し、修正を提案できるが、財団は、人間によるものであれ機械によるものであれ、欧州や世界の他の地域の人々が使用するブラウザに統合される前に、あらゆるパッチは同じレベルの技術的精査を受ける必要があると主張している。
この経験は、スペインや欧州連合内で開発されたものも含め、他のソフトウェアプロジェクトにも実用的なガイドを提供しました。AIベースのレポートを受け入れる場合は、 再現性の明確な証拠 この種の開示のための特定のチャネルを確立し、従来のエラー追跡システムに過負荷がかかるのを回避します。
ヨーロッパの開発者とテクノロジー企業への教訓
Firefoxをめぐるメディアの騒動の他にも、AnthropicとMozillaの協力は、次のような多くの重要な結論を生み出している。 スタートアップ、テクノロジー中小企業、そしてヨーロッパの大企業 独自のソフトウェアやデジタル サービスを開発する企業。
最も明らかなことの一つは AI支援によるコード監査は経済的に実行可能になった以前は専門家チームが何週間もかけて作業する必要があった作業が、今では最初の自動スイープを数時間または数日で実行でき、徹底的な手動レビューよりもはるかに低いコストで実行できます。
もう一つの教訓は、 検出速度が人間の修正能力を超え始めるClaude のようなツールを使用すると、数十の潜在的な脆弱性を迅速に見つけることができますが、システムの他の部分を壊すことなく、内部チームがそれらの問題を検証し、優先順位を付け、修正する能力がボトルネックになります。
また、 オープンソースはセキュリティの保証とは同義ではないしかし、大きな利点が一つあります。それは透明性です。プライバシーを重視していることからヨーロッパで非常に人気のあるFirefoxのようなプロジェクトでは、コミュニティと自動化エージェントの両方が継続的にコードをレビューできます。これはクローズドなソリューションでは不可能なことです。
多くの組織にとって、開発パイプラインにAIを統合すること(例えば、CI/CDフェーズに自動分析を組み込むこと)は、 規制遵守を証明する際の差別化要因これは、サイバーセキュリティと重要なソフトウェアに関する欧州規格の将来的な適用において、ますます重要になっています。
同時に、この事件は、攻撃者も同様の技術にアクセスできることを思い起こさせるものでもある。 現時点では守備側が有利のようだ。AI は欠陥を悪用するよりも、欠陥を見つけて修正するのを手助けすることに優れていますが、この利点が何年も続くことを当然と考える人はいません。
このシナリオでは、銀行から電子商取引プラットフォーム、デジタルユーティリティに至るまで、欧州企業のセキュリティ管理者は、これらのツールを実験的な追加機能としてではなく、 ソフトウェア保護戦略のもう一つの要素.
FirefoxとAnthropicの失敗は、適切に導かれ、教師ありのAIモデルがいかにして最高レベルのセキュリティ監査人として機能できるかを示しています。大規模なコードベースをレビューし、複雑なエラーを検出し、迅速に解決策を提案することができます。同時に、ソフトウェアと脅威の進化のペースが加速し続ける中で、最終的な決定は依然として人間のチームに委ねられており、パッチを何に適用し、どのように適用し、どのような優先順位で適用するかを決定しなければならないことも明らかになりました。