Search Results 報告書

公正を実現する：生成モデルにおけるバイアスの認識と解消

2021年、プリンストン大学の情報技術政策センターは、機械学習アルゴリズムが人間と同様の偏見を抱くことがあるという報告書を公表しました

データモデリングの成功を解き放つ：3つの必須のコンテキストテーブル

データモデリングは、分析チームにとって課題となることがあります各組織には独自のビジネスエンティティが存在するため、それぞれのテーブルに適切な構造と詳細度を見つけることは限りなく難しいものですしかし、

2023年の最高の人工知能（AI）ニュースレター

人工知能（AI）分野では、AIの進展について情報を得て先を見るために、様々なAIニュースレターが登場しています

ドキュメント指向エージェント：ベクトルデータベース、LLMs、Langchain、FastAPI、およびDockerとの旅

ChromaDB、Langchain、およびChatGPTを活用した大規模ドキュメントデータベースからの強化された応答と引用されたソース

Googleの2023年の経済的影響報告書では、AIがイギリスの経済に与える潜在的な影響を理解するために取り組んでいますこの報告書は、Public Firstによって編集され、Googleの検索、マップ、ワークスペース、クラウド、プレイ、Androidなどのツールが、今年イギリスの経済価値で約1,180億ポンドを創出するということを明らかにしていますまた、適切な条件の下では、AIの革新によって2030年までにイギリスの経済価値を4,000億ポンド以上創出する可能性も示しています以下は、報告書の主な調査結果の概要です：生産性の向上新しいAIのイノベーションは、イギリスの生産性を大幅に向上させる可能性がありますPublic Firstによると、生成型AIはイギリスの平均労働者が1年間に100時間以上を節約することができ、Google検索の登場以来、労働者の生産性の最も大きな向上となるでしょうまた、AIはGPsや教師の行政業務においても年間70万時間以上の作業時間を節約することができます過重な仕事量と過度な労働時間は、医療や教育の労働力不足の問題を悪化させ、人々がこれらの分野から離れる最も重要な要因ですAIの活用により、医療や教育などの分野における成長するコスト圧力の一部を緩和し、公共部門の資源を80億ポンド以上他の用途に活用することができますキャリアのアクセシビリティの向上 AIは、助成技術を活用して、障害を持つ人々が働く上での課題を解決する可能性がありますこれにより、年間300億ポンド以上の経済効果を生み出すことができます国立統計局（ONS）の統計によると、現在の英国の労働年齢人口の約5分の1が障害を抱えており、障害を持つ人々は就労率が約3分の1低く、経済活動に参加しにくい状況にあります AIが生成するキャプションなどの技術は、障害を持つ人々が独立性を取り戻し、周囲とのつながりを築き、仕事に復帰する選択肢を与えることができますこれにより、イギリスの経済成長の機会が生まれますスキルへのアクセスの解放 AIは、デジタル経済を最大限に活用するために必要なデジタルスキルをすべての人々に提供するのに役立つことができますAIのチューターやコーディングアシスタントの活用により、デジタルスキルの向上が容易になり、イギリスの生産性を年間48億ポンド以上向上させることができます今日、35%の企業が優れたデジタルスキルを持つスタッフの採用に困難を感じており、職に就けていない39%の人々がデジタルスキルの不足を就労の障害と捉えていますこのため、2015年以来、Googleはイギリス全土で500箇所以上を訪れ、現在では100万人以上の人々にデジタルスキルを教えることで、彼らのビジネスやキャリアの成長を支援していますこれらは、AIがイギリスの生産性を劇的に向上させ、国全体に経済的なブーストをもたらすために重要な役割を果たす3つの例ですこの潜在能力を引き出すためには、公共、私営、第三セクターが協力して取り組むことが重要ですイノベーションを促進するための新しい社会的イノベーション基金 Google.orgのAIに関する社会的イノベーション基金は、AIを活用してコミュニティを支援するプロジェクトを進めるイギリスの社会起業家に、100万ポンド相当の資金を割り当てます選ばれた社会起業家は、現金助成金、メンタリング、Google for Startups Acceleratorチームによる加速支援を受けることができ、彼らの革新的なアイデアが意味のある変化をもたらす機会を得ることができます社会起業家は、Social Tidesのウェブサイトで興味を登録することができますイギリスへの継続的な取り組みこの国は、テクノロジーのリーダーシップの豊かな伝統を続ける巨大な機会を持っていますGoogleは20年以上にわたり誇りを持って拠点としてきたイノベーションの中心地です政府は、イギリスがAI、科学、テクノロジーの世界的リーダーになり、すべての地域にテクノロジー主導の成長と機会をもたらすために、デジタルスキルをすべての人々に提供するという目標を掲げていますGoogleはそのビジョンに協力しており、持続可能で責任あるインパクトのあるテクノロジーを通じて、イギリスのすべての人々が自分の大きな目標と小さな目標を実現できるよう支援しています Googleの完全なイギリス経済影響報告書はこちらでご覧いただけます

AI
UK

オリジナルのPDFのフォーマットを保持し、Amazon Textract、Amazon Translate、およびPDFBoxで翻訳されたドキュメントを表示します

様々な業界の企業は、大量のPDF文書を作成し、スキャンし、保存しています多くの場合、その内容はテキスト中心であり、別の言語で書かれているため、翻訳が必要ですこの問題に対処するためには、PDF内のコンテンツを自動的に抽出し、迅速かつ効率的に翻訳する自動化ソリューションが必要です多くの企業は多様な[…]

Matplotlibを使用してインフォグラフィックを作成する

データを扱い、データサイエンティストとして仕事をするためには、魅力的で興味深いデータの可視化を作成することが重要ですこれにより、読者に情報を簡潔な形式で提供することができ、理解を助けることができます

SalesforceはXGen-7Bを導入：1.5Tトークンのために8Kシーケンス長でトレーニングされた新しい7B LLMを紹介します

最近の人工知能の技術的なブレークスルーにより、Large Language Models（LLMs）はますます一般的になっています。過去数年間、研究者たちは、これらのモデルを膨大な量のデータでトレーニングして、複雑な言語関連のタスクを解決するための急速な進歩を遂げてきました。これには、複雑な言語パターンの理解、連続した回答の生成などが含まれます。特に研究者や開発者の関心を引いている研究の1つは、LLMsの長文コンテンツの取り扱いにおける応用です。これらのタスクの例は、テキストの要約やコードの生成などの比較的単純なタスクから、タンパク質の構造予測や情報検索などのより複雑な問題の記述まで様々です。長いテキストのシーケンスには、段落、表、画像などさまざまな形式の情報が含まれているため、LLMsはこれらの要素を処理し理解するためにトレーニングされなければなりません。さらに、長距離の構造的依存関係を効果的に考慮することで、LLMsはテキストの異なる部分間の関連性を特定し、最も関連性の高い情報を抽出することができます。したがって、より広範な知識に触れることで、LLMsはユーザーのクエリにより正確で文脈に即した回答を提供することができます。しかし、数多くの潜在的なユースケースにもかかわらず、MetaのLLaMAからMosaicMLのMPT LLMモデルに至るまで、ほとんどのオープンソースのLLMsは、最大2Kトークンのシーケンスでトレーニングされています。この制限は、より長いシーケンスのモデリングにおいて大きな課題を提起します。さらに、モデルのスケーリングに関する以前の研究は、固定された計算予算が与えられた場合、トークン数が多いほど小さなモデルの方が大きなモデルよりも優れたパフォーマンスを発揮することを示しています。したがって、現在の進歩と課題に着想を受けて、Salesforce ResearchはXGen-7Bを導入し、1.5兆トークンの8Kシーケンス長でトレーニングされた一連の7B LLMsにおいて画期的な成果を上げました。このモデルシリーズには、4Kシーケンス長に対応するXGen-7B-4K-Base、8Kシーケンス長に対応するXGen-7B-8K-Base、および公開用の教育データでファインチューニングされたXGen-7B-8k-Instが含まれています（研究目的のみで公開されています）。これらのLLMsの注目すべき特徴は、XGenがMPT、Falcon、LLaMAなどといった同様のサイズの最先端のLLMsと比較して、標準のNLPベンチマークで同等または優れた結果を達成することです。この研究で使用されたXGen-7bモデルは、Salesforceの独自のライブラリJaxFormerを使用してトレーニングされました。このライブラリは、TPU-v4ハードウェアに最適化されたデータとモデルの並列処理を利用した、効率的なLLMのトレーニングを可能にします。トレーニングプロセスはLLaMAのガイドラインに従い、さらに2つの追加の調査を行いました。最初の調査は「損失スパイク」の理解に焦点を当てました。これは、トレーニング中に損失が突然一時的に増加する現象であり、明確な原因がない状態です。これらのスパイクの原因はまだ不明ですが、研究者は「順次回路の並列化」、「swish-GLUの使用」、「RMS-Normの使用」などがトレーニングの不安定性に寄与する可能性があると特定しました。2つ目の調査はシーケンス長に関連しています。自己注意の二次の計算量のため、より長いシーケンスでのトレーニングは計算コストが著しく増加するため、段階的なトレーニングアプローチが採用されました。トレーニングは最初にシーケンス長2kの800Bトークンから始まり、次にシーケンス長4kの400Bトークン、最後にシーケンス長8kの300Bトークンを対象としました。 XGen-7b 8kモデルの長い文脈の理解能力を評価するために、研究者たちは3つの主要なタスクで評価を行いました。それらのタスクは、長い対話生成、テキストの要約、および質問応答です。研究者は、対象のタスクの難しさに基づいて、インストラクションに調整されたモデルを使用しました。長い対話生成に関しては、AMIミーティングの要約、ForeverDreaming、およびTVMegaSiteの脚本の要約の3つのタスクを評価に使用しました。すべての指標において、XGen-7B-instモデルは他のいくつかのインストラクションに調整されたモデルと比較して最高のスコアを達成し、優れたパフォーマンスを示しました。長文の質問応答に関しては、研究者は物理学、工学、歴史、エンターテイメントなどさまざまなトピックをカバーするウィキペディアのドキュメントを基にChatGPTを使用して質問を生成しました。質問と元の文書の関連性、構成、および関連性に基づいて、256トークンのLLM生成された回答をGPT-4で評価しました。このシナリオでは、2kトークンに制限されたベースラインモデルに比べて、XGen-7B-8k-Instモデルのパフォーマンスが優れていることが示されました。テキストの要約に関しては、研究者は会議の会話と政府の報告書という2つの異なるドメインのデータセットを使用してXGen-7bモデルを評価しました。その結果、XGen-7bモデルはこれらのタスクで他のベースラインモデルを大幅に上回り、テキストの要約でも優れたパフォーマンスを発揮することが示されました。評価により、XGen-7bモデルは、長い文脈を理解する能力に優れており、長い対話生成、質問応答、テキスト要約など、さまざまなタスクで優れた性能を発揮しました。その性能は、他の指示に調整されたモデルやベースラインモデルを上回り、広範なテキスト文脈での理解力と連続した応答生成能力を示しています。ただし、その効果的さにもかかわらず、XGenモデルには制約があることが研究者によって認識されており、バイアスが免除されず、有害な応答を生成する可能性があります。これは、他の多くのAIモデルと共有する特徴です。Salesforce Researchはまた、コードをオープンソース化して、コミュニティが研究内容を探求できるようにしています。 SF BlogとGithub Linkをチェックしてください。最新のAI研究ニュース、素晴らしいAIプロジェクトなどを共有している25k+ ML SubReddit、Discord Channel、Email Newsletterにもぜひ参加してください。上記の記事に関する質問や見落としがある場合は、お気軽に[email protected]までメールでお問い合わせください。

PythonとPandasを使用したデータ集計：地質学のリソロジーデータの分析

データ集約技術を使用することで、圧倒的でほとんど理解できない数値データセットを、消化しやすく、読み手にとってもより親しみやすい形に変換することができますこのプロセスは…

2023年のトップビジネスインテリジェンスツール

トップのビジネスインテリジェンスソリューションは、データの洞察を見つけ、ステークホルダーに効果的に伝えることを容易にします。データは、営業やマーケティングからワークフローと効率性、採用と人事、総合的なパフォーマンスと収益性まで、あらゆるものに対して収集できるため、企業が意味のある洞察を見つけるために大量のデータを見極めることは今まで以上に重要です。しかし、この情報のほとんどは分断されており、専門のビジネスインテリジェンス（BI）ツールの助けを借りてのみ組み合わせることができます。キーパフォーマンスインジケータ（KPI）は、このデータが正確な予測に基づいてビジネスの運営を改善する方法の一つです。多くのプログラムは組み込みの分析機能を提供していますが、その結果をビジネスインテリジェンスシステムにエクスポートすることができます。最高のビジネスインテリジェンスツールは、複雑なデータのプレゼンテーションを簡素化するため、関係者に提示できるインタラクティブな表現に基づいています。以下に、現在市場でトップのビジネスインテリジェンスツールを示します。 actiTIME actiTIMEは、企業の生産性を把握するのに役立つ時間とプロジェクト管理システムです。時間とプロジェクトの進捗状況は、そのサポートによってリアルタイムで監視することができ、予算内および期限内に終了することができます。この透明性とコントロールのレベルにより、管理者はリソースの割り当て、優先順位の設定、タイムテーブルについてよく情報を得て、よく判断することができます。actiTIMEのパフォーマンスデータとトレンドの視覚的表現は、管理者の迅速な状況把握を助けます。このグラフィックは、停滞、非効率性、改善の機会を見つけるのに役立ちます。このデータに基づいて是正措置を講じ、チームがプロジェクトの目標に積極的に取り組んでいることを保証します。 SAS Viya SAS Viyaは、堅牢で柔軟なビジネスアナリティクスプラットフォームであり、データへの簡単なアクセスと洞察に基づく分析を瞬時に提供します。モダンなマイクロサービスアーキテクチャに基づいて構築されたSAS Viyaは、ビッグデータと高度なアナリティクスの複雑さに対応できるようになっており、困難なビジネスの課題を解決し、情報を元にした適切な選択を行うことができます。SAS Viyaは、重要なデータとトレンドのグラフィカルな表現を提供し、分析を迅速化し、意思決定を改善します。報告書、チャート、マップ、ダッシュボードはすべて対話形式で表示されます。さらに、意思決定者の専門知識にかかわらず、意思決定の最適化を支援するために、決定木、シナリオシミュレーション、自動予測も含まれています。 Oracle BI Oracle BIは、ビジネスがより良い意思決定のためにデータを収集し分析するために使用できる包括的なBIツールセットです。高度な分析、レポート作成、ダッシュボードの機能など、さまざまなツールとテクノロジーにアクセスできます。これは、さまざまな業界で活動する企業の要求に合わせてカスタマイズできる堅牢なシステムです。Oracle BIを使用することで、企業はデータをよりよく理解し、生産性を向上させ、未開発の成長の機会を見つけることができます。Oracle BIには、営業プロセスの最適化から顧客行動分析、業績に関する具体的な洞察まで、企業が次のレベルに進むために必要なすべてが備わっています。 Clear Analytics 組織は、堅牢なデータレポートツールであるClear Analyticsを利用して、市場で優位に立つことができます。使いやすいインターフェースと強力な機能により、Clear Analyticsを使用することで、複雑なデータセットを迅速かつ効果的に分析し、トレンドを把握し、データに基づいた意思決定を行うことができます。事前のトレーニングは必要ないというのは、その主な利点の一つです。ほとんどの人にとって既に馴染みのあるExcelの機能を活用することで、Clear Analyticsは、より少ない時間と労力でパワフルなデータ分析機能を提供します。ソフトウェアはMicrosoft…

Learn more about Search Results 報告書 - Page 18