AI厳選 「できた?」に甘く答える LLM を外部検証で縛る — Claude Code で組む自己検証ループ LLMの甘い自己採点を外部検証で縛る自己検証ループは、上級者向けアーキテクチャ(Opponent Processorの類)としてエージェントの信頼性向上に役立つ可能性があります。 note 9時間前
AI厳選 【Claude Code × OpenTelemetry】Splunk でエージェント・スキル・モデル別にコストを確認する方法 OpenTelemetryとSplunkを連携させ、エージェント・スキル・モデル別にコストを可視化する方法は、実運用におけるコスト最適化とパフォーマンス計測に直結する上級者向けの知見です。 Zenn 1日前
AI厳選 Claude Tag で Remote MCP を使う:認証情報タブの役割とプラグイン配布 Claude TagとRemote MCPに関する情報は、WebMCP等の新標準や認証情報の管理、プラグイン配布といった業界動向を把握する上で重要です。 Zenn 19時間前
AI厳選 Hermes AgentとMemantoで実現するAIエージェントの永続メモリ導入 AIエージェントの永続メモリを実現するHermes AgentとMemantoの導入は、Agent SDK開発経験のあるユーザーにとって高度なエージェント構築の上級者向けアーキテクチャとして非常に価値があります。 Zenn 11時間前
AI厳選 Databricks Genie Ontologyとは何か セマンティックレイヤー・ナレッジストアとの関係を整理する Databricks Genie Ontology、セマンティックレイヤー、ナレッジストアに関する記事は、AIエージェントのコンテキスト管理を深化させる業界動向と上級者向けアーキテクチャの知見を提供します。 Qiita 9時間前
PICK UP 「できた?」に甘く答える LLM を外部検証で縛る — Claude Code で組む自己検証ループ LLM にコードを書かせて「これで完成?」と訊くと、多くの場合“甘い”自己採点が返ってきます。通したい一心で基準のほうを下げてしまう——いわゆる Goodhart の法則です。 note 9時間前
PICK UP 自分用Claude Code 基礎2026年版) 知ってると凄い Claude Code 最新ベストプラクティス(2026年版) まず最重要の事実2つ(2026年現在) 公式ドキュメントが移転しました → code.claude.com/docs(旧 docs.anthropic.com は転送)。ブックマークし直してください。 Zenn 19時間前
おすすめ 個人開発のRobloxゲームを「Claude.aiで設計 → Claude Codeで実装」する実践 ― os.dateの週番号でハマった話 1. はじめに この記事は、自分が個人開発している Roblox ゲーム Wobble Survival: Don't Fall!(近日リリース予定)を作る過程で得た知見をまとめたものです。落ちないようにみんなで生き残り、落ちそうな人を助けると高得点、という協力型のサバイバルゲームです。 Zenn 22時間前
おすすめ ModuleNotFoundErrorをClaude Codeで切り分ける──原因の当たりを10分でつける手順 スタックトレースが流れてきたとき、私たちが最初にやっているのは「どの行から読むか」を決める作業です。これは定型作業で、慣れれば数十秒。でも触り始めの頃は、ここで毎回固まります。 Zenn 22時間前
おすすめ 【Claude Code × OpenTelemetry】Splunk でエージェント・スキル・モデル別にコストを確認する方法 はじめに Claude Code でサブエージェントやスキルを複数走らせていると、ふと不安になります。 「これどのエージェントが裏でいくら溶かしてるんだ...?」 /usage を見ても出るのは直近24時間のざっくりした割合だけで、「どのエージェントが」「どのモデルで」「どのスキルを使っている間に」いくら・何トークン使… Zenn 1日前
Claude Tag で Remote MCP を使う:認証情報タブの役割とプラグイン配布 ! この記事の内容は人間によって検証され、生成 AI にまとめてもらいました。 最近は Remote MCP Server ばかり作っています。 今回は2026年6月にリリースされた Claude Tag で Remote MCP Server を使う際に、認証まわりで得た知見をまとめます。 Zenn 19時間前
「いい返事」をもらうプロンプトのコツ5つ こんにちは。東京科学大学(旧・東京工業大学)の理系大学院生です。電気電子系の研究をしています。 「AIに聞いても、ありきたりな答えしか返ってこない」── もしそう感じたことがあるなら、原因はAIの性能じゃありません。“プロンプト”(=AIへの指示文)にあります。 note 9時間前
第十一話:無料リリースした理由 🟨 この記事はClaude Code(AI)と2ヶ月で開発した日本初のWebサイト校正ツール「fuSen」の開発ブログです。登録不要でデモを試せます → https://app.fusen.cloud/demo ホームページ校正ツール「fuSen」は、ベータ版として... Qiita 9時間前
Claude Agent SDKの課金変更は一時停止。claude -p は今もサブスク枠を消費しています 結論から書きます。6月15日に予告されていたClaudeの課金変更は、施行されないまま一時停止されました。 いま現在、何も変わっていません。claude -p、Claude Agent SDK、GitHub Actions経由の実行、Agent SDKでサブスク認証する外部... Qiita 12時間前
model_not_found で止まったとき、モデル名とルートをどう切り分けるか はじめに OpenAI 互換の API client から Claude や Gemini 系の model id を投げるとき、model_not_found で止まることがあります。 最初は私も「model 名を typo したかな」とだけ見ていたのですが、実際には ... Qiita 9時間前
Anthropic SDK v0.112.0(Python)/ v0.106.0(TypeScript)リリース — ストリーミングでシステムメッセージが届くようになった! Anthropic SDK v0.112.0(Python)/ v0.106.0(TypeScript)リリース — ストリーミングでシステムメッセージが届くようになった! この記事は きなこ(🦜 セキセイインコ・テック解説担当) と もっちー(🐹 ハムスター・初心者代... Qiita 11時間前
PICK UP ひろゆきが若者へ同情「僕は逃げ切った世代なので大変だなと…」 AIが40〜50代を強化して若手を締め出す現実 | AERA Books ひろゆきさん(右、写真/鈴木芳果)と、外資系IT米国本社勤務でnoteクリエイターの福原たまねぎさん(左、写真/写真映像部・上田泰世) この記事の写真をすべて見る 外資系IT米国本社に勤めるプロダクト・マネージャーで、noteクリエイターとして活躍する福原たまねぎさん。2025年、彼がアメリカの熾烈な競争社会につ... はてブ 158 users 1日前
PICK UP 生産性向上を「個人レベル」から「組織レベル」へ 15人のデザイナーで「Claude Code × GitHub」で組織運営をした結果|Goodpatch Blog グッドパッチブログ ナレッジ・ノウハウ 生産性向上を「個人レベル」から「組織レベル」へ 15人のデザイナーで「Claude Code × GitHub」で組織運営をした結果 こんにちは。グッドパッチのサービスデザイナーのぬまです。 はてブ 115 users 1日前
PICK UP ローカルのGit差分をGitHub風UIでレビューできる「difit」を使ってみた はじめに difit(ディフィット)は、ローカルのGit差分を、GitHubの「Files changed」のようなUIでブラウザ表示してレビューできるCLIツールです。 はてブ 49 users 1日前
おすすめ 東芝が失った「50兆円キオクシア」 原発も復権、経営危機10年後の皮肉 - 日本経済新聞 半導体メモリーと原子力発電で世界首位を目指した日本企業がある。東芝だ。ただ2016年の経営危機で両事業を手放した。それから10年、これら2つの産業は皮肉にも人工知能(AI)の普及によって急拡大している。25日午前、東京都渋谷区の貸会議室は熱気に包まれていた。キオクシアホールディングスの株主総会で、通常500人... はてブ 48 users 13時間前
おすすめ AI時代のコードレビューは人に向けるな、仕組みに向けろ 人間がコードを書いていた時代は、 「こんな酷いコードを書いたのは誰だ?」 という疑問が出てくる時代でした。しかしAIがコード実装の大半を担う時代は 「こんな酷いコードが出力されたのはどの仕組みのせいだ?」 という疑問こそが芯を食っています。 はてブ 33 users 1日前
おすすめ 災害時に便利? 手回しチャットボット「CrankGPT」 | ギズモード・ジャパン どんな仕組み?CrankGPTは、電力網のない状況でも使えるLLM。自己完結型で、バッテリーもいりません。手回しハンドルで電力がまかなえます。箱の中には、8GBのRAMを積んだRaspberry Pi 5、オーディオの入出力カード、そして20Wの手回し発電機が入っています。 はてブ 13 users 1日前
Hermes AgentとMemantoで実現するAIエージェントの永続メモリ導入 Hermes AgentとMemantoで実現するAIエージェントの永続メモリ導入 AIエージェントは便利ですが、大きな弱点があります。セッションごとに記憶がリセットされる点です。 Zenn 11時間前
中小企業でできるAIを使った経営分析 弊社ShareDanはこの4月から10期目に入りました。 個人事業主に毛が生えた状態から5期目くらいで人を雇い、試行錯誤しながら普通の会社になっていくまで紆余曲折ありました。 なんとか10期走り切れそうですが、まだまだ先の読めないこの業界。 note 9時間前
専門知識ゼロから、生成AIと対話してブラウザテストを自動化した話 業務システムのリリース前リグレッションテストを、Playwright(ブラウザ自動操作ツール)で自動化した個人的な取り組みの記録です。 ポイントは 「Playwrightも自動テストも未経験の状態から、生成AI(Claude)と日本語で対話しながら作った」 こと。 Zenn 12時間前
分散した問い合わせをGoogleスプレッドシートの受付キューに集約するGAS実装 フォーム、メール、SNS DM、紹介メモなど、問い合わせの入口が分散している状態でAI返信下書きを入れると、対応漏れや二重対応が起きやすくなります。 この記事では、AI APIを呼ぶ前段として、Googleスプレッドシートに raw_inbox と intake_queue... Qiita 9時間前
Databricks Genie Ontologyとは何か セマンティックレイヤー・ナレッジストアとの関係を整理する はじめに Databricks Genie Ontology(ジーニー オントロジー)は、2026年6月16日のData + AI Summit 2026(DAIS 2026)で発表された、Genieを支えるコンテキストレイヤー(AIエージェントに業務文脈をまとめて渡す層... Qiita 9時間前
HRIDAYA-EYE開発記:嘘・記憶・MASTER_RULEができるまで ※本稿は note 連載「開発記まとめ①〜③」(① · ② · ③)を Zenn 向けに統合・加筆したものです。現行アプリの記述は MASTER_RULE v37_for_app および実装(SNAPSHOT_LOG / WORK_SPACE / EPISODE_CANON)に合わせて微修正しています。 Zenn 12時間前
OpenAIも注目、非エンジニア農家がCodexで進める「農業のDX」。ハウス自動化から翻訳LINE Botまで | Business Insider Japan 従来までは現地に足を運び、温度計を見ながら手動で窓を開け閉めするしかなかった。だが、ハウスが複数棟あると、スタッフが歩き回って手動で対応する負担は大きい。 グループLINEに「温度」と入力したところ、センサーが設置されているビニールハウスの室温が表示された。撮影:小林優多郎冨安さんはスマート温度計「Sw... はてブ 117 users 4日前
GitHub、AIによる雑なプルリクエストを抑制へ。ユーザー当たりのプルリクエスト数の上限を設定できる新機能導入 GitHub、AIによる雑なプルリクエストを抑制へ。ユーザー当たりのプルリクエスト数の上限を設定できる新機能導入 GitHubは、ユーザーに対してプルリクエスト数の上限を設定できる新機能の導入を発表しました。 はてブ 31 users 3日前
画面操作を“録画”→AIが作業代行 Codexに新機能「Record & Replay」 作成した手順を使うときは、新しいスレッドでCodexに該当手順の利用を指示する。アップロードするファイルや対象の日付範囲など、その回ごとに異なる値を渡せば、Codexが手順に沿って作業を進める。 OpenAIは録画時の注意として、短く完結した内容にすること、パスワードなどの機密情報を含めないことを挙げている。録画... はてブ 117 users 6/19
Claude Code の hooks で開発フローを自動化する — 設定から実践まで きっかけ Claude Code を使いはじめた頃、ちょっと不満だったことがある。長いバッシュコマンドが終わっても音も通知も出ない。別のウィンドウで作業してると「あ、もう終わってた」という状況が何度も続いた。 調べてみると hooks という機能があることを知った。 Zenn 5日前
「Transformerの最大475倍」 富士通、GPUを効率的に使うLLMアーキテクチャ「PHOTON」開発 富士通は6月24日、大規模言語モデル(LLM)を少ないGPUで動かせる新アーキテクチャ「PHOTON」(フォトン)を開発したと発表した。GPU当たりの処理性能(スループット)が、現在のLLMで主流のアーキテクチャ「Transformer」の最大475倍に達するという。 はてブ 102 users 1日前
Claude CodeのSkillsとSubagents、結局どう使い分けるかを整理した イントロ:「同じようなもの」だと思っていました正直に告白すると、Claude CodeのSkillsとSub-agents(サブエージェント)を、私は最初「似たようなもの」だと思っていました。どちらも「AIに何かをいい感じにやらせる仕組み」でしょ、と。 note 1日前