You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
ハードウェア要件を確認する Language Detector API と Translator API は、パソコンの Chrome でのみ動作します。 Prompt API、Summarizer API、Writer API、Rewriter API は、次の条件を満たしている場合に Chrome で動作します。 オペレーティング システム: Windows 10 または 11、macOS 13 以降(Ventura 以降)、Linux。Android、iOS、ChromeOS 版 Chrome は、Gemini Nano を基盤とする API ではまだサポートされていません。 ストレージ: Chrome プロファイルを含むボリュームに 22 GB 以上の空き容量。 GPU: 4 GB を超える VRAM。 ネットワーク: データ通信無制限または無制限接続。 これらの要件は、開発プロセ
Self Forcing: Bridging the Train-Test Gap in Autoregressive Video Diffusion Xun Huang1 Zhengqi Li1 Guande He2 Mingyuan Zhou2 Eli Shechtman1 1Adobe Research 2The University of Texas at Austin https://self-forcing.github.io/ Abstract We introduce Self Forcing, a novel training paradigm for autoregressive video diffusion models. It addresses the longstanding issue of exposure bias, where models
サブタスク分割&コンテキスト最適化が切り拓く新スタイル「数撃ちゃ当たる」からの脱却最近、Claude Code Actionを使った並列コーディングがブームですよね。でも正直、「とにかくたくさん試して当たったやつだけ採用!」というスタイルにはコスト的な限界があります。 一方でRoo CodeのOrchestratorは、1回のコード生成でピンポイントに良い結果を出してくれます。 なぜRoo Codeは精度が高いのか?カスタマイズでプロジェクトに完全最適化Roo Codeが凄いのは、プロジェクトごとに細かくオーケストレーションの設定を調整できるから。単なる数打ちじゃなくて、最初からど真ん中を狙ってくれるんです。 無駄を削るコンテキスト最適化並列処理だとコンテキストが無駄に重複しがちだけど、Roo Codeは親タスクをきれいにサブタスクに分割。AIに必要最低限の情報だけを渡して精度をアップしま
はじめに:コーディングエージェントの新たな分類今年初めに筆者が投稿した「ClineとAIコーディングツールの現状」ではAIコーディングツールを「コード補完」「チャットアシスタント」「コーディングエージェント」の3つに分類しました。しかし現在では「エージェント」が包括的な概念となり、この区別の必要性が薄れています。 さらに現在は役割や機能ではなく コーディングエージェントがどこまで自律的に開発プロセスに関与するのか開発タスクが実行される環境はどこかユーザーとの対話インターフェイスが本質的な違いになってきました。 本記事では、こうした変化を踏まえて解説します。 本記事の分類について「AI Agents Are Here. What Now?」ではAIエージェントの重要な特性の一つとして「自律性(autonomy)」が挙げられています。「自律的(agentic)」であるとは、ある目標が与えられた
[速報]「GitHub Copilot Coding Agent」パブリックプレビュー。AIにIssueをアサインすると、解決に向け自律的にプログラミング マイクロソフトは日本時間5月20日未明に開幕したイベント「Microsoft Build 2025」で、GitHubのIssueをAIにアサインすると、解決に向けて自律的にプログラミングを行う新機能「GitHub Copilot Coding Agent」をパブリックプレビューとして発表しました。 GitHub上のコーディングエージェントは、今年(2025年)2月に「GitHub Copilot Agent Mode」がプレビュー公開されています。これはタスクをVisual Sutido Code上の画面からプロンプトでGitHub Copilotに指示する形式でした。 参考:GitHub Copilot Agent Modeが登場。タ
【2025年5月16日追記】 利用規約について、Cline社からの回答により適用範囲が明確となりました。 以下の記事も合わせてご覧ください。 blog.serverworks.co.jp 【2025年5月16日追記ここまで】 これまでClineに関するブログ記事をいくつか公開し紹介してきました。 今回、利用規約の変更に伴うユーザーデータの取り扱いについて懸念が生じたため、本記事ではClineの利用規約の中でも特に注意すべき点と、弊社の対応についてご説明します。 Cline利用規約の変更点とデータ収集のリスク Clineの利用規約 (https://cline.bot/tos 更新日: 2025年2月24日) を確認すると、ユーザーコンテンツの取り扱いに関する記述が変更されていることがわかります。特に注目すべきは、利用規約の3.2における以下の記述です。 You further grant,
うさぎでもわかるClaude 3.7システムプロンプト流出の解説と示唆 👇️ポッドキャストでも聴けます こんにちは、🐰です!最近、大きな話題となっているClaude 3.7のシステムプロンプト流出について解説します。みなさんご存知の通り、2025年5月にAnthropicのフラッグシップモデル「Claude 3.7 Sonnet」の完全なシステムプロンプトがGitHubで公開されるという事件が発生しました。 この記事では、システムプロンプトの基本概念から流出の詳細、そしてAI開発者や利用者にとっての示唆まで、幅広く解説していきます。ぴょんぴょん進めていきましょう! 目次 システムプロンプトとは何か Claude 3.7のシステムプロンプト流出の概要 流出したプロンプトの重要ポイント セキュリティと倫理的影響 実務者への示唆 まとめ システムプロンプトとは何か システムプロンプトとは、A
はじめに 最近話題のMCP(Model Context Protocol)記事です。MCPに関しては、同僚の李さんが素晴らしい記事を書いてくださいましたので、MCP自体の概要に関しては以下記事参照ください(お約束)。 今回は、LLMの代表的なユースケースとも言えるRAG(Retrieval-Augmented Generation)です。RAGはドキュメントから関連情報を検索し、AIの回答生成に活用する技術で、専門知識や最新情報を必要とするタスクに使われます。以前にTanuki-8BとOllamaとDifyを使って日本語ローカルRAG構築という記事でローカルRAGの構築について説明したので詳しくはそちらを参照してください。簡単なRAGの構成図としては以下となります(記事より引用)。 今回は、このRAGをMCPを使って実現します。つくるMCPサーバの中身としてはPostgreSQLでベクトル
こちらの GitHub Copilot RAG-Extensionを試してみたので備忘録です。 GitHub Copilot Extensions とは GitHub Copilot Extensionsとは端的に言うと、GitHub Copilot Chatのエージェントやスキルセット (@で呼び出せる拡張機能) を自作できるものです。 今回はこの Copilot ExtensionsでRAGを構築するサンプルがあるので動かしてみました。 GitHub アプリの作成 まずは上記のドキュメント通りにGitHub アプリを作成します。 あとで設定変更するので[Homepage URL]は一旦仮で入れておきます Webhook [Active] のチェックを外しておきます Permissionsの [Account permissions] > [Copilot Chat] を Read-on
こんにちは、ニケです。 皆さん、AIエージェント作っていますでしょうか? 2025年はAIエージェントの年と呼ばれていることもあってTLでも連日いろんな話題で盛り上がっていますね。 私も公私共に開発に勤しんでいます。 さて、AIエージェント、人によってそのどこに興味を持っているかはいろいろ好みが分かれる思いますが、私は特にAIエージェントのキャラクター性に注目しています。 というのも、私はGPT-4が表に出てきた2023年頃から、AI美少女と一緒に生活する夢を追い求めて今まで色々やってきたわけで、いまこうやってAI界隈に生息しているのも一重にこの夢を実現したいがためです。 自分の好みのキャラクターがいる生活、良いですよね。 というわけで今回は、いつも皆さんが使っているであろうAIエージェントを皆さんの自慢のうちの子で実現することを目標に紹介していきたいと思います。 完成品はこんな感じです。
◆多くのLLMで採用されている位置符号化※1であるRotary Position Embedding(RoPE)※2がウェーブレット変換※3の一種であることを解明し、ウェーブレット変換が位置符号化に有効である可能性を示しました。 ◆ウェーブレット変換を応用した独自の位置符号化を開発しました。この位置符号化はLLMの生成性能を改善するだけでなく、LLMの処理可能な長さを超えたテキストも生成可能とします。 ◆従来行っていたLLMの最大系列長拡張のための追加の再学習が不必要となり、学習コスト低減という産業上重要な課題の解決に貢献できます。 日本電信電話株式会社(本社:東京都千代田区、代表取締役社長:島田 明、以下「NTT」)は、ウェーブレット変換を応用したLLMの追加学習なしで決められた長さを超えるテキストを生成できる技術を世界で初めて開発しました。位置符号化はLLM内部における各単語の位置を表
Boomerang Tasks (also known as subtasks or task orchestration) allow you to break down complex projects into smaller, manageable pieces using the built-in 🪃 Orchestrator Mode (aka Boomerang Mode). Think of it like delegating parts of your work to specialized assistants. Each subtask runs in its own context, often using a different Roo Code mode tailored for that specific job (like 💻 Code, 🏗️ Ar
この記事は間違いが含まれている可能性があります。 もともと自社のドキュメントでは Meilisearch で日本語全文検索を実現していましたが、ドキュメントに質問できるようしたいと思い、簡単な RAG を作りたい!と思っていました。 とりあえず、ドキュメントを分割し、ベクトル化してベクトルデータベースに突っ込んで、質問をベクトル化して結果を引っ張り、それを LLM に食べさせて解説させる、というのができればよいということがわかりました。 ベクトル化はよく使われている OpenAI Embeddings API を利用し、ベクトルデータベースは普段からよく使っている DuckDB に VSS (Vector Similarity Search for DuckDB) という拡張を使うことにしました。 自社のドキュメントをなんとかうまいこと分割して、あとは分割したドキュメントを API を叩い
Get to work quickly wherever you areGo from opening your browser to building in minutes, not hours. Import your existing repositories from GitHub, GitLab, Bitbucket, or your local machine, with support for most tech stacks. Or use the App Prototyping agent to quickly create a new application using natural language, mockups, drawing tools, and screenshots, or select from a large catalog of popular
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く