リアルタイムでスピーチを文字起こしするメガネ

ファッション界の新スター!リアルタイムでスピーチを文字起こしするメガネ!

人が言っている言葉を自動的に書き起こし、そのテキストを装着者の目の前のレンズに字幕として表示するアイウェア。 ¶ クレジット:Westend61/Getty Images

数社の企業が、「リアルタイム字幕メガネ」と言われる製品を販売し始めており、聴覚障害を持つ人々がレンズ上にリアルタイムに書き起こされた音声を表示することで聴覚のある人々とコミュニケーションをとるのに役立っています。

スタンフォード大学のトム・プリツキー氏は、彼の会社であるTranscribeGlassが製造するメガネは、キャプションや字幕を通じて会話の空白を補完することで、補聴器との相互補完を果たしていると述べています。

ほとんどのリアルタイム字幕メガネは、マイクロフォン、音声処理コンピュータ、バッテリー、テキスト表示装置を備えたアイウェアです。

音声処理アプリケーションプロバイダーのXRAI Glassのダン・スカーフ氏は、これらのイノベーションを音声認識ソフトウェアの進歩によるものとし、「このための絶対に使える最高のハードウェアが、6ヶ月以内に実現することはないと思います」と述べています。Scientific Americanより フル記事を見る

要旨の著作権は2023年 SmithBucklin、ワシントンD.C.、アメリカにあります

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

このAIの論文は、テキスト変換グラフとして言語モデルパイプラインを抽象化するプログラミングモデルであるDSPyを紹介しています

言語モデル(LM)は、リサーチャーにデータを少なく使用し、より高度な理解レベルで自然言語処理システムを作成する能力を与...

コンピュータサイエンス

「クリエイティブな人々がAIに対して訴訟で反撃しています」

「法的措置によってAI企業は自社のプログラムのトレーニング方法を変更することを強いられるのか?」

AI研究

このAI研究は、ロボット学習および具現化人工知能の研究のための包括的なソフトウェアプラットフォームとエコシステムであるRoboHiveを提案しています

近年、人工知能(AI)の進歩は、言語モデリング、タンパク質折りたたみ、およびゲームプレイなどで特に顕著なものがありまし...

機械学習

AWS Inferentiaでのディープラーニングトレーニング

この投稿のトピックは、AWSの自社開発AIチップ、AWS Inferentia、より具体的には第2世代のAWS Inferentia2ですこれは、昨年の...

機械学習

『Qwen Large Language Models(LLMs)Seriesについて知っておくべきすべて』

大型言語モデル(LLM)は、登場以来、人工知能(AI)の領域を大きく変えました。これらのモデルは、厳しい推論や問題解決の問...