Search Results がん

「人工知能（AI）企業に投資するトップのベンチャーキャピタル（VC）企業」

AI（人工知能）企業に投資しているベンチャーキャピタリストを見てみましょう。かつてロボットのアイデアは少し不安定でしたが、現在は機械が自己学習し成長するためのアーキテクチャとシステムに多額の投資が行われています。これには人間の支援なしで学習と成長が可能なものも含まれます。 PwCの2018 Moneytree Reportによると、2017年にAI企業に93億ドルが投資されました。この巨額の数値は、テクノロジーへの関心の高まりや、公共・商業セクターの寄付者の間でのポテンシャルに対する理解の高まりを示しています。人工知能は自動運転車のAIオペレーティングシステムから自己学習型の言語処理プラットフォームまで、あらゆるビジネス領域を横断しています。ベンチャーキャピタル企業はこれらのイニシアチブの背後にいる人々に資金を提供しており、これらのイニシアチブが多くの産業に変革をもたらす可能性があるため、競争力を保っています。 AI技術に投資している最も有名なベンチャーキャピタル企業は以下のとおりです。それぞれの目標についても概説しています。ソフトバンクグループソフトバンクグループは、日本を拠点とするグローバルな持株会社です。同国で最も裕福な男性である孫正義氏がAI研究に97％の「時間と知識」を費やしていると主張し、その責任を担っています。同社は最大のグローバルファンドであり、技術の進歩のために特にAIに重点を置いた930億ドルのソフトバンクビジョンファンドを持っています。そのうち28億ドルが新しい投資ファンドに割り当てられており、機械学習、顔認識、拡張現実、Petuum Inc.などに特化した企業であるSenseTimeに以前に投資しています。ジェネラルキャタリスト 2000年に設立されたジェネラルキャタリストは、アメリカのベンチャーキャピタル企業であり、成長段階や初期段階の株式投資を通じて企業の変革を支援しています。同社は企業の勢いを増し、成長を促進することに重点を置いています。彼らはすでに技術分野で自己を確立した成功したビジネスパーソンに投資しています。その中にはAIを活用したライティング支援のGrammarly、AIを活用した人事管理プラットフォームのEightfold.ai、現実世界の活動を刺激するAPIを作成するプログラムの6D.aiなどがあります。 Institutional Venture Partners アメリカに本拠を置く私募エクイティファームであるIVPは、企業の成長の最終段階においてしばしば資金を提供しています。IVPは、Slack、Github、Pindrop、Soundcloud、Indiegogoなどの有名な企業に投資した後、AIスタートアップへの重要な投資家となりました。2017年には投資ファンドにさらに15億ドルを追加し、総額7億ドルの投資資本を確保しました。特に、IVPは機械データ分析企業であるSumo Logicと、2018年のトップ5の資金調達を行ったAIベンチャーの1つであるZiprecruiterに投資しています。 Two Sigma Ventures 業界トップの企業であるTwo Sigma Investmentsには、Two Sigma…

土木技術者からデータサイエンティストへのキャリア転換

はじめに土木技術者からデータサイエンティストへの転身は、個人的および職業的成長の可能性が非常に高い、刺激的で挑戦的な旅です。土木技術者は、問題解決の才覚と分析能力を持っており、データサイエンスのダイナミックな世界にシームレスに溶け込む強固な基盤を持っています。土木工学からデータサイエンスへの転身の旅を探求し、両分野の関連性を明らかにし、移行可能なスキルを特定し、必要なデータサイエンスのスキルを習得するためのガイダンスを提供しましょう。土木工学はデータサイエンスと関連していますか？土木工学とデータサイエンスは、異なる分野のように見えるかもしれませんが、関連性や重なりがあります。土木工学のスキルはデータサイエンスに応用されます。両分野のキーポイントは以下のとおりです：問題解決のアプローチ：両者は共に体系的で分析的な問題解決を必要とし、土木技術者の複雑さを分解する能力はデータサイエンスのタスクに補完されます。データ収集と分析：土木プロジェクトは膨大なデータセットを生成しますが、これはデータサイエンスがデータの収集と分析に頼っていることと類似しています。統計分析：土木技術者は構造の安全性に統計を使用しますが、これはデータサイエンスがパターン認識と予測のために使用していることと並行しています。数理モデリング：モデルの作成は土木工学とデータサイエンスの両方で一般的であり、振る舞いの予測とアルゴリズムの構築に使用されます。地理空間分析：土木技術者は地理空間データを使用しますが、データサイエンスはそれを空間的な洞察と予測に活用しています。データの可視化：両者は可視化技術を使用して結果を提示し、洞察を効果的に伝えます。リスク評価と意思決定：土木技術者はプロジェクトのリスクを評価しますが、データサイエンスはデータに基づいた意思決定と予測モデリングを提供します。持続可能なインフラストラクチャ：データサイエンスは、リソースの最適化や保守ニーズの予測により、持続可能なインフラストラクチャに貢献することができます。関連記事：2023年にデータサイエンティストになるためのステップバイステップガイド類似点と移行可能なスキル土木工学とデータサイエンスの類似点を認識することで、プロフェッショナルはギャップを埋め、スムーズなキャリアの転換を実現することができます。以下に、両分野で共通のスキルを探求してみましょう：技術スキル土木技術者は、複雑なデータセットの解釈や統計分析、数理モデリング、データ操作の技術がデータサイエンスで重要です。彼らはMATLAB、Python、またはRなどの言語を使用してシミュレーションやデータ分析を行い、データサイエンスでの前処理、機械学習、データ可視化にも容易に転用できるスキルを持っています。彼らは大規模なデータセットの管理と処理に優れており、有意義な洞察を抽出する能力があります。これはデータサイエンスでのデータのクリーニング、変換、分析において重要なスキルセットです。領域知識土木技術者の建物、橋、交通ネットワークなどの物理システムに関する専門知識は、データサイエンスのインフラストラクチャのパフォーマンス、最適化、資産管理の分野と関連しています。環境に関する考慮事項の専門知識は、データサイエンスの環境データの分析、トレンド予測、リソース最適化において価値があります。ソフトスキル土木技術者の協力とプレゼンテーションのスキルは、非専門家向けに洞察を効果的に伝えるためにデータサイエンスで重要です。…

「MITの研究者が、おそらくほぼ正確な（PAC）プライバシーによる機械学習モデルのプライバシー保護において、ブレークスルーを達成」

MITの研究者たちは、機械学習モデル内にエンコードされた機微なデータを保護するという課題について、大きな進歩を遂げました。科学者のチームは、肺スキャン画像から患者ががんを持っているかどうかを正確に予測できる機械学習モデルを開発しました。しかし、このモデルを世界中の病院と共有することは、悪意のある者によるデータ抽出の重大なリスクを伴います。この問題に対処するため、研究者たちは、PACプライバシーという新しいプライバシーメトリックを導入し、機微なデータを保護するために必要な最小限のノイズを決定するフレームワークを開発しました。従来のプライバシーアプローチ（ディファレンシャルプライバシーなど）は、大量のノイズを追加することで特定のデータの使用を区別できなくすることに焦点を当てていますが、これによりモデルの精度が低下します。PACプライバシーは、ノイズが追加された後も、敵対者が機微なデータの一部を再構築する難しさを評価するという異なる視点を持っています。たとえば、もし機微なデータが人間の顔である場合、ディファレンシャルプライバシーは敵対者がデータセット内の特定の個人の顔を特定することを防ぎます。一方、PACプライバシーは、敵対者が特定の個人の顔として認識できる近似のシルエットを抽出できるかどうかを探求します。 PACプライバシーを実装するために、研究者たちは、モデルに追加する最適なノイズの量を決定するアルゴリズムを開発しました。このアルゴリズムは、敵対者の視点から元のデータの不確実性またはエントロピーに依存しています。データをサブサンプリングし、機械学習のトレーニングアルゴリズムを複数回実行することで、アルゴリズムは異なる出力間の分散を比較し、必要なノイズの量を決定します。分散が小さいほど、より少ないノイズが必要とされます。 PACプライバシーアルゴリズムの主な利点の1つは、モデルの内部動作やトレーニングプロセスの知識を必要としないことです。ユーザーは、敵対者が機微なデータを再構築する能力に関する所望の信頼レベルを指定し、アルゴリズムはその目標を達成するための最適なノイズの量を提供します。ただし、アルゴリズムはモデルにノイズを追加することによる精度の損失を推定しません。さらに、PACプライバシーを実装することは、さまざまなサブサンプリングされたデータセットでの繰り返しトレーニングにより、計算上の負荷が高くなる可能性があります。 PACプライバシーを強化するために、研究者たちは、サブサンプルの出力間の分散を減少させることで安定性を高める機械学習のトレーニングプロセスを変更することを提案しています。このアプローチにより、アルゴリズムの計算上の負担が軽減され、必要なノイズの量が最小限に抑えられます。さらに、より安定したモデルは一般化エラーが低くなり、新しいデータに対するより正確な予測が可能となります。研究者たちは、安定性、プライバシー、および一般化エラーの関係についてさらなる探索が必要であることを認識していますが、彼らの研究は、機械学習モデルにおける機微なデータの保護に向けた有望な一歩を示しています。PACプライバシーを活用することで、エンジニアは実世界のアプリケーションにおいても精度を維持しながらトレーニングデータを保護するモデルを開発することができます。必要なノイズの量を大幅に削減する可能性があるため、この技術は医療分野やその他の分野での安全なデータ共有の新たな可能性を開拓します。

NotebookLM グーグルの実験的なAIノートブック、学習と洞察のための向上したもの

Googleは最近、Google I/Oカンファレンスでプロジェクトテイルウィンドとして知られるものをNotebookLMとして発表しました。AIを最初に考慮した実験として、NotebookLMは言語モデルの力を活用して学習を向上させることを目指す独自のノートブックです。Google Labsによって開発されたこの実験的なオファリングは、ロバストな言語モデルを中心にしたノート作成ソフトウェアを再構築することを目指しています。 NotebookLMの動機は、現代の忙しい世界で個人が直面する情報過多の増加する課題に由来します。データの豊富さは圧倒的であり、人々が意味のある洞察を引き出すことが難しくなります。Googleはこの課題に気付き、学生、教授、知識労働者と対話し、彼らの困難を理解しました。最も一般的な課題の1つは、複数の情報源から事実やアイデアを統合する時間のかかるプロセスでした。これに対応して、Googleはユーザーが最も重要な情報源を使用してより効率的に関連付けを行うことを可能にするソリューションを作成するための旅に着手しました。その結果がNotebookLMです。この実験的な製品は、言語モデルとユーザーの既存のコンテンツを活用して、加速されたペースで重要な洞察を解き放つことを目指しています。ユーザーが選択した情報源に基づいて、事実を要約し、複雑な概念を説明し、新しい関連性の探索を容易にする仮想的な研究アシスタントのようなものと考えてください。 NotebookLMは、一般的なAIチャットボットとは異なる「ソースグラウンディング」という概念によって他とは一線を画しています。言語モデルをユーザーのノートや情報源に結びつけることで、NotebookLMはそれぞれのユーザーに関連する特定の情報に詳しいパーソナライズされたAIを作成します。プロセスは、Googleドキュメントをグラウンディングソースとして選択することから始まります。Googleドキュメントとの統合により、次の3つの主な機能が可能になります： 1. サマリーを取得：GoogleドキュメントをNotebookLMに追加すると、システムが自動的にドキュメントの要約、主要なトピックや質問と共に提供され、ユーザーにより良い理解を提供します。 2. 質問する：ユーザーがもっと深く掘り下げたい場合、アップロードしたドキュメントについて質問することができます。たとえば、医学生が神経科学に関する科学論文をアップロードし、NotebookLMに「ドーパミンに関連するキーワードの用語集を作成してください」と指示することができます。 3. アイデアを生成する：NotebookLMの機能は、質問応答の対話を超えて広がります。ユーザーが創造的なアイデアを生み出すのを助けることに優れています。たとえば、コンテンツクリエイターが新しいビデオのアイデアをアップロードし、NotebookLMに「このトピックに関するショートビデオの台本を生成してください」と依頼することができます。 NotebookLMのソースグラウンディングにより、モデルが不正確な応答を生成するリスクを最小限に抑える一方で、ソース素材に対してAIの応答をファクトチェックすることが重要です。Googleは、各応答に引用を含めることによって、使用されたソースから最も関連性の高いオリジナルの引用を示すことで、このプロセスを容易にします。 NotebookLMの開発は、Google Labs内の小さなチームによる協力的な取り組みです。チームの主な目標は、ユーザーのニーズを満たす製品を構築し、責任ある技術の展開を確保することです。これらの目標を達成するために、Googleは積極的にユーザーやコミュニティからのフィードバックを求め、NotebookLMの有用性を向上させることを目指します。さらに、同社はAIの原則に合致した厳格な安全基準に従い、ユーザーベースを拡大し、新しい機能を導入する前に適切な保護策を実施します。プライバシーの懸念に対応するために、GoogleはNotebookLMを設計し、ユーザーが選択したアップロードされたソース素材へのモデルのアクセスを制限します。さらに、ユーザーのファイルとAIとのやり取りはプライベートであり、他のユーザーからはアクセスできません。Googleは収集されたデータを新しいAIモデルのトレーニングに使用せず、ユーザーのプライバシーとデータ保護に対する取り組みを強調しています。 Googleはユーザーフィードバックに基づいて製品を改善し、ますます価値が高まり、使いやすくなることを目指しています。NotebookLMを使用することで、Googleはノートの作成と情報の統合を革新し、ユーザーに広範な知識の景観をナビゲートし、情報を実行可能な洞察に変換する強力なツールを提供することを目指しています。

「APAC地域で注目すべき10のAIスタートアップ」

アジア太平洋地域は、先進的なコンピューティングとAIの中心地として急速に成長しています日本、インド、シンガポール、韓国、台湾などの企業が、AIを前進させる地域のイノベーションハブを作り出し、想像を絶する高みに押し上げていますそれぞれが、だけでなく、景色を完全に変える可能性を持っています...

AI WebTVの構築

AI WebTVは、自動ビデオと音楽合成の最新の進歩を紹介するための実験的なデモです。 👉 AI WebTVスペースにアクセスしてストリームを視聴できます。モバイルデバイスを使用している場合は、Twitchのミラーからストリームを視聴できます。 AI WebTVの目的は、ZeroscopeやMusicGenなどのオープンソースのテキストからビデオを生成するモデルを使用して、エンターテイニングでアクセスしやすい方法でビデオをデモすることです。これらのオープンソースモデルは、Hugging Faceハブで見つけることができます: ビデオ用: zeroscope_v2_576とzeroscope_v2_XL 音楽用: musicgen-melody 個々のビデオシーケンスは意図的に短く作られており、WebTVは芸術方向性やプログラミングを持つ実際のショーではなく、テックデモ/ショーリールとして見るべきです。 AI WebTVは、ビデオショットのシーケンスを取り、テキストからビデオを生成するモデルに渡してテイクのシーケンスを生成することで動作します。さらに、人間によって書かれた基本テーマとアイデアは、LLM（この場合はChatGPT）を通じて渡され、各ビデオクリップごとにさまざまな個別のプロンプトを生成するために使用されます。以下は、AI WebTVの現在のアーキテクチャのダイアグラムです: WebTVはNodeJSとTypeScriptで実装されており、Hugging Faceでホストされているさまざまなサービスを使用しています。テキストからビデオへのモデル中心となるビデオモデルはZeroscope…

「AIが医療におけるケースの結果を向上させるのに役立っている方法」

人工知能（AI）は、多くの産業において変革の力として現れており、医療業界も例外ではありません機械学習とデータ分析の進歩により、AIは医療専門家が患者の診断、治療、管理を行う方法に革命をもたらしています医療におけるAIの最も重要な貢献の一つは、ケースの結果を向上させる能力ですこの記事では、AIが医療におけるケースの結果を向上させるのにどのように役立っているかについて紹介します

「過小評価されている宝石Pt.1：あなたをプロにする8つのPandasメソッド」

しばらくはChatGPTを忘れましょう私たちの中には、シンプルなPandasの操作を行いたいときに毎回解決策をグーグルで検索することで疲れてしまう人もいます同じことをするための方法は数多く存在するようです...

「SimCLRの最大の問題を修正する〜BYOL論文の解説」

SimCLRは対比学習のアイデアを成功裏に実装し、当時新たな最先端の性能を達成しました！それにもかかわらず、このアイデアには根本的な弱点があります！…に対する感度が高いのです

「2023年の機械学習モデルにおけるトップな合成データツール/スタートアップ」

実際の出来事の結果ではなく、意図的に作成された情報は、合成データとして知られています。合成データはアルゴリズムによって生成され、機械学習モデルのトレーニング、数学モデルの検証、テストプロダクションや運用データのテストデータセットの代替として使用されます。合成データを使用する利点は、プライベートまたは制御されたデータを使用する際の制約の緩和、正確なデータでは満たせない特定の状況にデータ要件を調整すること、DevOpsチームがソフトウェアテストや品質保証に使用するためのデータセットを生成することなどです。元のデータセットの複雑さを完全に複製しようとする際の制約は、不一致につながる可能性があります。実用的な合成例を生成するには、正確で正確なデータが依然として必要であるため、正確なデータを完全に代替することは不可能です。合成データの重要性ニューラルネットワークをトレーニングするために、開発者は広範で細心の注意を払ったデータセットが必要です。AIモデルは通常、より多様なトレーニングデータを持っているほど正確です。問題は、数千から数百万のアイテムを含むデータセットを編集し、識別するのに多くの労力がかかり、頻繁に手頃な価格ではないことです。ここで偽のデータが登場します。AI.Reverieの共同創設者であるPaul Walborsky氏は、ラベリングサービスから6ドルかかる単一の画像を、6セントで合成的に生成できると考えています。お金を節約することは始まりに過ぎません。Walborsky氏は、「合成データは、プライバシーの懸念や偏見を減らすため、現実世界を正確に反映するためのデータの多様性を確保することが重要です。」と述べています。合成データセットは、時には現実のデータよりも優れている場合があります。合成データは自動的にタグ付けされ、意図的に一般的ではないが重要な特殊な状況を含めることができます。合成データのスタートアップおよび企業のリスト Datagen イスラエルの企業Datagenは2018年に設立され、2,200万ドルの資金調達を行っています。そのうち1,850万ドルのシリーズAが2月に行われ、その時が同社の公式な登場の機会でした。Datagenは、人間の動きに明らかな専門知識を持ち、フォトリアリスティックな視覚シミュレーションと自然界の再現に特化しており、その特異な合成データを「シミュレートデータ」と呼んでいます。Datagenは、合成データを扱う多くの他の企業と同様に、生成的敵対的ネットワーク（GAN）というAI手法を使用しています。これは、2つのシステム間のコンピューター将棋のようなものであり、一方が架空のデータを生成し、他方が結果の真実性を評価します。Datagenは、GANを物理シミュレーターと組み合わせ、強化学習ヒューマノイドモーションテクニックとスーパーレンダリングアルゴリズムを使用しています。 Datagenは、小売業、ロボット工学、拡張現実、仮想現実、モノのインターネット、自動運転車など、様々な産業をターゲットにしています。例えば、Amazon Goの場所のような小売自動化では、コンピュータービジョンシステムが買い物客を監視して、誰もが不正行為をしないことを確認しています。 Parallel Domain 自動運転車のための環境シミュレーションは、現在最も一般的なユースケースの1つです。それがSilicon ValleyのスタートアップであるParallel Domainの主要な事業領域です。Parallel Domainは2017年に設立され、その後約1,390万ドルの資金調達を行っています。その中には、昨年末の1,100万ドルのシリーズAも含まれています。トヨタはおそらく最大の支援者および顧客です。Parallel Domainは、合成データプラットフォームを使用して自動運転車に人々を殺すことを避ける方法を教えるために、最も困難なユースケースに焦点を当てています。最近の開発では、トヨタリサーチインスティチュートとのパートナーシップにより、合成データを使用して物体の恒久性について自律システムに教えています。現在の認識システムは、Parallel Domainのおかげで一時的に消える場合でもオブジェクトを追跡できるようになりましたが、まだpeek-a-booのようなものです。さらに、同社は完全に注釈付きの合成カメラとLiDARデータセットのデータビジュアライザを一般に公開しています。同社は、自律型ドローンデリバリーや自動運転のための人工的なトレーニングデータも提供しています。 Mindtech…

Learn more about Search Results がん - Page 55