リアルタイムでスピーチを文字起こしするメガネ

ファッション界の新スター!リアルタイムでスピーチを文字起こしするメガネ!

人が言っている言葉を自動的に書き起こし、そのテキストを装着者の目の前のレンズに字幕として表示するアイウェア。 ¶ クレジット:Westend61/Getty Images

数社の企業が、「リアルタイム字幕メガネ」と言われる製品を販売し始めており、聴覚障害を持つ人々がレンズ上にリアルタイムに書き起こされた音声を表示することで聴覚のある人々とコミュニケーションをとるのに役立っています。

スタンフォード大学のトム・プリツキー氏は、彼の会社であるTranscribeGlassが製造するメガネは、キャプションや字幕を通じて会話の空白を補完することで、補聴器との相互補完を果たしていると述べています。

ほとんどのリアルタイム字幕メガネは、マイクロフォン、音声処理コンピュータ、バッテリー、テキスト表示装置を備えたアイウェアです。

音声処理アプリケーションプロバイダーのXRAI Glassのダン・スカーフ氏は、これらのイノベーションを音声認識ソフトウェアの進歩によるものとし、「このための絶対に使える最高のハードウェアが、6ヶ月以内に実現することはないと思います」と述べています。Scientific Americanより フル記事を見る

要旨の著作権は2023年 SmithBucklin、ワシントンD.C.、アメリカにあります

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「DeepSeek:中国最新の言語モデルの支配」

In a recent development, the DeepSeek LLM has emerged as a formidable force in the realm of language models, boasting...

機械学習

「AnimateDiffとは モデル特有の調整なしでパーソナライズされたテキストからイメージ(T2I)モデルをアニメーション生成器に拡張するための効果的なAIフレームワーク」

テキストから画像(T2I)生成モデルは、研究コミュニティ内外から前例のない注目を集めており、芸術家やアマチュアなどの非研...

AIニュース

「スマートフォンアプリが肝臓手術における安全性を向上させる」

国際の研究チームが、肝臓手術を受ける患者に対して個別のリスクスコアを提供するスマートフォンアプリケーションを開発しました

人工知能

AIは発明できるのか?

法律の専門家グループが特許庁、裁判所、政策立案者に問題に対処するよう求めていますジェネレーティブAIは、他の独自の人間...

機械学習

このAI論文は、柔軟なタスクシステムと手順的生成による強化学習を革新するNeural MMO 2.0を紹介しています

MIT、CarperAI、Parametrix.AIの研究者らは、Neural MMO 2.0を導入しました。これは、多様な目的と報酬信号を定義できる柔軟...

機械学習

このAI論文は、「パーシウス」という画期的なフレームワークを紹介していますこれにより、大規模な機械学習やAIモデルのトレーニング時のエネルギー浪費を最大30%削減することが可能です

大きな言語モデル(GPT-3など)は、トレーニングと推論中の計算ニーズにより、相当なエネルギーを必要とします。エネルギー使...