Windows Copilot Library の強力な API を使用して AI アプリを開発できるようになります。

ファイシリカモデルも今夏登場予定

読書時間アイコン 2分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

キーノート

  • Microsoft は、AI を中心とした多くの発表を携えて到着しました。
  • Windows Copilot Library には、ローカル AI 開発用のいくつかの強力な API が間もなく提供される予定です。
  • 発表された API には、スタジオ エフェクト、ライブ キャプション翻訳、OCR などが含まれます。

Microsoft にとって今週は忙しい週でした。レドモンドのテクノロジー巨人は、次のような AI を中心とした多くの発表を携えて到着しました。 Copilot+ PC そして月曜日の年次Buildカンファレンスでは新しいPhi Silica小型モデルが発表されました。そして今回、Windows Copilot Library にローカル AI 開発用の強力な API がいくつか追加されました。 

Microsoft によると、DiskANN を含む少なくとも 40 を超えるオンデバイス AI モデルとアルゴリズムが Windows Copilot Library にネイティブに組み込まれています。さらに、スタジオ エフェクト、ライブ キャプション翻訳、OCR、ユーザー アクティビティによるリコールなど、すぐに使用できる AI API も備えています。 

なぜ重要なのかというと、これらの API を使用すると、開発者がアプリ内に AI エクスペリエンスを簡単に組み込めるようになるからです。たとえば、WhatsApp は Windows Studio エフェクト API を使用しており、ユーザーがアプリ内でカメラを使用するときに AI エフェクトを使用できるようになります。

「ベクター埋め込み、検索拡張生成 (RAG)、テキスト要約は、他の API とともに、後で Windows Copilot Library に追加される予定です。開発者はリリースの一部としてこれらの API にアクセスできるようになります」と Microsoft はブログ投稿で約束しています。

たとえば、リコール機能を使用すると、ユーザー アクティビティ API を通じて役立つ情報を追加することでユーザー エクスペリエンスを向上できるため、ユーザーはアプリで中断したところから簡単に続行できます。

API は「アプリケーション プログラミング インターフェイス」であり、異なるプログラム間の通信を仲介するものであり、アプリの開発方法に影響を与えます。

Microsoft の最新の小規模言語モデルである Phi Silica は、開発者が試せるように 3 月から利用可能になります。 Phi-1.5 ファミリから構築された Phi Silica は、「Copilot+ PC の NPU 用にカスタム構築」されており、よりコスト効率が高く電力に優しい製品になります。 650 トークン/秒での最初のトークン レイテンシの消費電力はわずか XNUMX ワットです。