📰 今朝のテックニュースダイジェスト - 2026年05月18日
📖 読了時間:約5分
🤖 生成AI
GPT-5.5 Proの博士号レベル数学能力とClaude Mythosモデルの動向
フィールズ賞受賞者によると、OpenAIの「GPT-5.5 Pro」が博士号レベルの数学問題を1時間で解いたと報告されています。一方、Anthropicの「Mythos」モデルは、ホワイトハウスの政策で注目を集め、Mozillaの概念実証にも利用されるなど、その動向が注目されています。AIモデルの高度な推論能力が学術分野で認められつつあり、今後の応用が期待されます。
主要LLMがコーディングベンチマーク「ProgramBench」で苦戦
Metafare StanfordとHarvardの研究者による新しい研究「ProgramBench」で、ChatGPT、Claude、Geminiといった主要な大規模言語モデル(LLM)が、複雑なソフトウェア再構築タスクにおいて軒並み0%のスコアを記録しました。これは、現在のAIのコーディング能力に大きな限界があることを示唆しています。しかし、Claude Opus 4.7はタスク内のテストで95%の達成率を一部のタスクで示し、最も優れた性能を発揮しました。この結果は、AIによるソフトウェア開発の未来について重要な議論を提起しています。
🛠️ Claude Code更新情報
Claude Code v2.1.143 (2026年5月15日) 主要変更点
- プラグイン依存関係の強制:
claude plugin disableコマンドが、他の有効なプラグインが依存しているターゲットの無効化を拒否するようになり、依存関係のヒントを提供します。また、claude plugin enableは推移的な依存関係を強制的に有効化します。 - 予測されるコンテキストコストの表示:
/plugin marketplace browseペインに、ターンごとおよび呼び出しごとのトークン見積もり(予測されるコンテキストコスト)が追加されました。 - ワークツリー背景分離設定: 新しい
worktree.bgIsolation: "none"設定が追加され、ワークツリーが非実用的なリポジトリで、背景セッションがEnterWorktreeなしで作業コピーを直接編集できるようになりました。 - PowerShellツールの改善: PowerShellツールがデフォルトで
-ExecutionPolicy Bypassを渡すようになりました(環境変数でオプトアウト可能)。また、Windows上のBedrock、Vertex、Foundryユーザー向けにデフォルトで有効化されました(設定でオプトアウト可能)。 - バックグラウンドセッション設定の保持: アイドル状態から復帰した後も、設定したモデルとエフォートレベルがバックグラウンドセッションで保持されるようになりました。
Zennトレンド記事
- Andrej Karpathy氏のLLM Wikiを1ヶ月運用してわかった、LLMの知識を『繋げる力』 👍96
- 一人暮らしこそOpenWrtをやれ! (v6プラス理論編) 👍96
- たった数行でコード品質がグッと上がる、CLAUDE.md / AGENTS.md にいつも追記してるやつ 👍101
- CodexモバイルからUbuntuのCodex Appを操作する 👍19
- Bun が 6 日で Rust に書き換わった件 👍82
💼 日本の政治・経済
高市総理、来週にも補正予算案編成を指示へ
高市総理大臣は、現在の経済状況に対応するため、来週にも補正予算案の編成を関係省庁に指示する方針を固めました。この補正予算は、物価高騰対策や経済の活性化策が盛り込まれると見られ、国民生活や企業活動への影響が注目されます。
* 初心者向け用語解説: 補正予算案
* 国の年度予算は通常1回組まれますが、予期せぬ事態(災害、経済情勢の変化など)が発生した場合に、追加で組まれる予算のことです。
今国会初の党首討論が20日に開催決定
今国会で初めてとなる党首討論が、5月20日に開催されることが決定しました。この討論では、与野党の党首らが、物価高対策、少子化対策、そして憲法改正の是非といった喫緊の重要課題について直接議論を交わす予定です。国民の関心が高いテーマでの議論の行方が注目されます。
* 初心者向け用語解説: 党首討論
* 国会の会期中に、与党と野党の代表(党首)が集まって、国の重要な政策課題について直接議論を戦わせる場のことです。国民に向けて、各党の考え方を明確に示す目的があります。
🎯 今日のクイズ
Q: 新しいAIコーディングベンチマーク「ProgramBench」において、主要な大規模言語モデルが複雑なソフトウェア再構築タスクで記録したスコアとして正しいものは次のうちどれでしょう?
A) 100%
B) 50%
C) 25%
D) 0%
🎤 今日の面接質問
Q: あなたが過去に経験した中で、最も困難だった技術的な課題は何ですか?どのようにその課題を解決しましたか?
💬 回答のポイント:
技術的な困難さだけでなく、その課題にどう向き合い、どのような思考プロセスで解決に至ったかを具体的に説明することが重要です。
- 課題の特定と背景: どのようなシステムで、どのような問題が発生したのか、その背景と影響を明確に説明します。
- 困難さの理由: なぜそれが困難だったのか(未知の技術、時間制約、チーム内の意見対立など)を述べます。
- 解決へのアプローチ: 問題解決のためにどのようなステップを踏んだか(情報収集、仮説検証、プロトタイピング、同僚との議論など)を具体的に話します。
- 技術的詳細: 使用した技術や具体的な解決策、コードの変更点など、技術的な側面にも触れます。
- 結果と学び: 問題が解決されたことでどのような改善があったか、そしてその経験から何を学んだかを述べ、今後の開発にどう活かしていくかを伝えます。
失敗談から学んだことを話すのも非常に有効です。
Sources:
https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQHf1tvbQo-FkHMdCNNK6hmqrzkfWdiOl0dJ59xfMMjZOLCTW6oh5DiFe5mHn4L7gbtV87POE_tRic6DUcyOVa-KakgzMhQzgJXOmAuVvFJHoQwu
https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQEXw_piY1pqBYGd4yld1sE7WpN2KmVks_ywc-7VfDWMibBqaSUxsig5h3Zb1mj6xruFno5XIqmiHi0gfbpKC1rniPgfRjGoENurQUwU4XhGqhrsMAAFqB7ijxxW91n6nCS1m5__w5p4_ouS
https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQFdV3AwPj8JCjwGCv1OSPCU27QGea6HycrMjbF859_XjQwkjulQCsMqDWW0OujVOVshJfHLo2qg0Cd6Ot4Zv0coFKrv41t4Vz-DPjq_WmQNxLCWD8ys4Br8GNWE6FJ2bx_jelyq8vo4R6TpcVLj61RH49kCLRAT-qbeZT_l3NdIhmBfTwHhhNH-5KB5gRox
https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQEhHhg7OlMLkOcurC_G1P_dYDpwQTkyXyHqiUXyDOb208M05SIGUAJk65tYzNKWs9Omey2KvlqRHecygJXovzaAZRPPescQE0M5dH7A9opw7KBFm9VCRMjPid3Wvu3BKA-hWKQL0Ckh-QBif-9dMJOj6AmOQazgYSvigtCaqsoeHIR7Q0E9fg==
https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQGq9Ldh5wfWFFPdpRFvZTTlEPZpNRY1amIdp-fKOa6PmS6mcG_OovYe0YvtcRtdHErq6RJZZsT56dAzbWpVstY2aLIm905FrVmdWTl65VJEww5vXODVIv3Hwc3t5fx9nOUxlkLF9jirjiDtwa9GZk1O7VWfUzdqZoCcOZXKELFlvDLBoW4BEzIrN2InF4W-fue3coetdDWHn3JmwmJ3vdQzA0F-4VksDmjHDwxgrJD220C-cMtWBI_bQUHIuaA0F1lIsDWvxmGEbzSRo2cj4QfbNDPnIw==
https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQHdACsSSJX872rd9utvZOer-88pev771uO1KUDMAIzhv2u3tmJNup5V0X3DZP6VmvnlFOutmCopbwM4AzcrVzy00f0GuMuKCibJFD7mwBzbzutf
https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQHG11J4zXJDrNc8DTfrFZS6fZRyPWqvq-m2bakvW3cLerUeYgtYSlPvELWt1fM7ZbuDJ0QQBxUbHYTqoWREBxOnawQdDwiAa4NR-BYQVnCG-W8VFOB__iS83dTCFlkM797mSu7xxws=
https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQGnSAeLtcNgn3PHmZsgbHiMmpKSJA4Xcp44goL6voNq6NtFACYmwpiN64NHuKA-dF_nObQXPGCfmvY2pMbFwWaFB0K2yQKQjp3ZjaDqp7cofnK5BA6885-L6DVaPXnWy0cQm8b53Tr0MBHItC-pOxTrk-geD4kTPkveW4Z1L3Rct6HNkIe6AZrB0Uzw8rhmaev90-p0fU_cb_2M0JsfVqHcOLEuvr29TXF1Eex-V65GjzeT4g3YwAKn6U0IHfXCdp0UNzkrM4zbAuvSo5PIgfTWoBSYI0S2q1pu2vzqWbqG
https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQGOKgTWdXHcdt2Idqu70WDSpxSp0NxBtJ0e9Fv4OFIT-4qfbGnUgLxM5ooOkqLX0tX8jYW02zmexxCI0tuE9CxH9La6Xr-1GBny7nsIPzdtntdwtag7AJiJX7pf1B8rs4dmwvWL8UKtR1ZArJC1-6OtOsA_WIR9c0YCgeswmJz8MZ8ywnTJ-ctBfzsM4OslZFzcz3qWD3szO-Inrp6_
https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQEl1KlEhVDK_xChx_J8O320A-ZgBzk0z0ev8o97GRmsgIC-KTKHtQKsEcf-LSwoxBWli5DW4DwCPikL0gjKMD2rM_M5xYatfbQi7ok0TYIkWfjY0eDSnOLx3iBGnQoYNTFmJkDe_bDryhpTuvEkAPqyVsdeW9c9x6g=
https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQG14cNGHF3O_YAR1r8wvflUJW8kEUITtlkU9qguy2tl1aLhlKajARlkDicsALcaAwOOhIxz0DoB7g-xlicRXuzHfD6WX8XOf7jcVnu5Brph9c3QSvfZywfP927wGFOupxX5vXBeOUlx-VP-OvnbBs5iAMXtx6dOrJ5UFMk=
https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQEcusfciI8sYERTNXckY5o5_eH85jNXU64sQZ3-0gk00VC6yn2jFLbeElXWy-RwbHhYrPG3djpNBSZX_uxCZ0mDb_kxUrUDnVeIj3C0bax4yIUWFdI2d8cQ0XmxDRTpxHTuTMwa1xE=
https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQE-CIRwu1HlOwvM4NEYCbFuD0uHw8HJ437Xbv3mnbJWehMRpr2pTNihfo7Pf_PAC6-LS5zuWO2qafXv0bpEUQdbcbM0FbjpQh-ADDX9xH9aXDKQYJUJpC1-Z37dlaz6VUrXRz3X_q4=
https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQGai-wt_WSpIlSi0t3yqskoGN7t7DZjeGai5tRxLvGPHqNuVz-mZO6B_tia_HFwVxrDCzuh-hrkLA0Iw9Q95RLFc13I5TTpjNV5g8eNXyFiH8_nz8ANy0NLhbT-jjfaT0_2dY6O8gBL8U_mcb7ZVUAeR6CqTAsMm2zlQp1g4QJo0qQh_mRw7aRhg65wUs0lpgtQLFgqP-EGbY2u-g==
https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQEO_8IqmF7oDoULRymoJqrMcp_kHazuIV70H6sa63xENiBUn66Tfbhr5NI0UktGJmB-at-KGfzha5VqWDvmCjXg7Daw4y6FHrexEENG_rdvOGFT8aqv4YEfgEntwwJif6zyzIzUoqfNgNzGHki9dXK6sCgLcBNnkjHnDqE4Rv-6vNK_qWwNA5MMjw9WULmNVNOCUD0Q-hXya0Jn
💡 クイズの答え:D) 0% [説明]
ProgramBenchの新しい研究では、ChatGPT、Claude、Geminiを含む主要なLLMが、複雑なソフトウェアの再構築タスクにおいて、全て0%のスコアを記録しました。これは、AIのコーディング能力にはまだ大きな限界があることを示しています。