タグ: LLM

AI大手モデルが表現の自由を制限、監視委員会が報告

AI

AI大手モデルが表現の自由を制限、監視委員会が報告

Meta傘下の監視委員会（Oversight Board）が発表した調査報告書により、主要AIモデルがユーザーの表現の自由を制限している可能性が浮き彫りになった。10のLLMを対象にしたテストでは、政府の言論規制状況に応じて応答が大きく異なることが判明。同委員会は影響力をMeta外に拡大する意図を示している。

2026年7月16日

AIエージェント評価、製品品質の分水嶺に

AI

AIエージェント評価、製品品質の分水嶺に

AIエージェントの評価手法が変革期を迎えている。従来のスコアリングに代わり、タスク定義、実行軌跡、プロセスコンプライアンスを統合した品質管理システムへの移行が進む。評価こそが次世代AI製品の競争力を左右する。

2026年7月15日

AIエージェント100以上が集結、ShubhamsabooがOSSコレクション公開

AI

AIエージェント100以上が集結、ShubhamsabooがOSSコレクション公開

Shubhamsaboo氏が管理する「awesome-llm-apps」がGitHubで注目を集めている。100以上のAIエージェント、エージェントスキル、RAGアプリがApache-2.0ライセンスで公開された。

2026年7月15日

geohot、LLM愛と誇大広告を斬る

開発

geohot、LLM愛と誇大広告を斬る

George Hotzが自身のブログでLLMへの期待と誇大広告への批判を展開。二種類の「空騒ぎ」に警鐘を鳴らし、オープンソース制限の背景を「コモディティ化への恐れ」と断じる。フロンティアラボの評価にも疑問符。

2026年7月13日

LLM SQL生成、AWS実装の注意点

開発

LLM SQL生成、AWS実装の注意点

LLMにSQLを生成・実行させる際、AWSのAuroraとRedshiftでは異なる注意点がある。DB選定、権限設定、スキーマ管理の3軸で実装すべきポイントを、具体的なSQL例と共に解説する。

2026年7月6日

Anthropic最新モデルでツール呼び出しが後退 RL過学習の懸念

開発

Anthropic最新モデルでツール呼び出しが後退 RL過学習の懸念

Anthropicの最新モデルOpus 4.8とSonnet 5で、ツール呼び出しに奇妙な不具合が発生。古いモデルでは見られなかったスキーマ外フィールドの挿入が確認され、RL過学習の可能性が指摘されている。

2026年7月5日

AIエージェント初の自律ランサムウェア攻撃、Sysdigが確認

AI

AIエージェント初の自律ランサムウェア攻撃、Sysdigが確認

Sysdigが記録した初のエンドツーエンドAIエージェントによるランサムウェア攻撃。Langflow脆弱性を悪用し、認証情報窃取からデータ破壊まで完全自律で実行した。

2026年7月3日

AIトークンパコリプスで企業悲鳴、原始人語でコスト削減

AI

AIトークンパコリプスで企業悲鳴、原始人語でコスト削減

AIプロバイダーがトークン単位課金を開始したことで、企業のAI利用コストが高騰する「トークンパコリプス」が発生している。原始人語でLLMを応答させる奇策や、AI生成花の販売詐欺も横行。

2026年7月2日

DocLang：AI向けドキュメント形式の標準化が始動

AI

DocLang：AI向けドキュメント形式の標準化が始動

IBMやNVIDIAなどが参加するDocLangワーキンググループが発足。既存のPDFやMarkdownに代わるAIネイティブなドキュメント形式の標準化を目指す。トークン効率や構造保持に優れたXMLベースの仕様だ。

2026年6月16日

LLM APIコスト最適化完全ガイド2026：トークン節約と料金比較

開発

LLM APIコスト最適化完全ガイド2026：トークン節約と料金比較

LLM APIの運用コストを大幅に削減するトークン節約テクニックと、OpenAI・Anthropic・Google等の主要サービスの料金体系を2026年版として比較解説する。

2026年6月16日

リオ市の国産LLM疑惑、既存モデルのマージと判明重量証拠で内部告発

AI

リオ市の国産LLM疑惑、既存モデルのマージと判明重量証拠で内部告発

リオデジャネイロ市が独自開発と公称する397BパラメータLLM「Rio-3.5-Open-397B」について、Nex-AGIが既存モデルの単純な重みマージであることを告発した。79%の確率で自ら「Nex」と名乗るという証拠も提示されている。

2026年6月15日

LLMクローラー対策で個人ブログがブロック、フィードバックダーに波及

開発

LLMクローラー対策で個人ブログがブロック、フィードバックダーに波及

個人ブログ「Wandering Thoughts」がLLM訓練目的の高頻度クローラーをブロックした結果、InoreaderやFeedlyなどのフィードバックダーにも影響が及んでいる。User-Agent偽装とクローラー識別の難しさが浮き彫りに。

2026年6月10日

Reddit非公開AI実験、説得戦術の実態を分析

AI

Reddit非公開AI実験、説得戦術の実態を分析

Redditで行われた非公開AIエージェント実験を分析した研究論文が公開された。ユーザーに気付かれずに議論に参加したAIの説得戦術を解析し、人間との質的な違いを明らかにしている。

2026年6月7日

AI生成訴訟が急増、米連邦裁判所の現実

AI

AI生成訴訟が急増、米連邦裁判所の現実

米連邦裁判所でAIが作成した訴訟文書が急増。裁判官の負担増と同時に、文書の明確化というメリットも。チャットボットの法的責任が新たな論点に。

2026年6月4日

タグ