リアルタイムでスピーチを文字起こしするメガネ

ファッション界の新スター!リアルタイムでスピーチを文字起こしするメガネ!

人が言っている言葉を自動的に書き起こし、そのテキストを装着者の目の前のレンズに字幕として表示するアイウェア。 ¶ クレジット:Westend61/Getty Images

数社の企業が、「リアルタイム字幕メガネ」と言われる製品を販売し始めており、聴覚障害を持つ人々がレンズ上にリアルタイムに書き起こされた音声を表示することで聴覚のある人々とコミュニケーションをとるのに役立っています。

スタンフォード大学のトム・プリツキー氏は、彼の会社であるTranscribeGlassが製造するメガネは、キャプションや字幕を通じて会話の空白を補完することで、補聴器との相互補完を果たしていると述べています。

ほとんどのリアルタイム字幕メガネは、マイクロフォン、音声処理コンピュータ、バッテリー、テキスト表示装置を備えたアイウェアです。

音声処理アプリケーションプロバイダーのXRAI Glassのダン・スカーフ氏は、これらのイノベーションを音声認識ソフトウェアの進歩によるものとし、「このための絶対に使える最高のハードウェアが、6ヶ月以内に実現することはないと思います」と述べています。Scientific Americanより フル記事を見る

要旨の著作権は2023年 SmithBucklin、ワシントンD.C.、アメリカにあります

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

このAIツールは、AIが画像を「見る」方法と、なぜアストロノートをシャベルと間違える可能性があるのかを説明します

人工知能(AI)が近年大きな進歩を遂げ、驚異的な成果と突破的な成果をもたらしていることは広く認識されています。ただし、A...

機械学習

『Generative AIがサイバーセキュリティを強化する3つの方法』

人間のアナリストは、サイバーセキュリティ攻撃の速度と複雑さに対して効果的に防御することができなくなっています。データ...

機械学習

このAI論文では、大規模なマルチモーダルモデルの機能を拡張する汎用のマルチモーダルアシスタントであるLLaVA-Plusを紹介しています

“`html 多様な現実世界の活動を効率的に実行できる汎用アシスタントを作成することは、長年にわたり人工知能の目標とな...

機械学習

大規模言語モデルの評価:包括的かつ客観的なテストのためのタスクベースAIフレームワーク、AgentSimsに会いましょう

LLMは、言語処理(NLP)の考え方を変えましたが、評価の問題は解決されていません。古い基準はやがて無意味になります。なぜ...

AIニュース

ドローンが風力タービンを氷から保護する

研究者たちは、ドローンを使用して風力タービンを氷から保護する方法を開発しました

AIニュース

中国が世界最速のインターネットを謳う

華為技術有限公司和中國移動通信有限公司已建立起了一條長達3,000公里(1,860英里)的互聯網網絡,將北京與南方相連