Search Results メール

Stack Overflowで最もよく尋ねられるPythonリストの10の質問

Stack Overflowは、ソフトウェア、コーディング、データサイエンスなど、さまざまな分野において、数千もの質問と回答を見つけることができる情報の宝庫ですもしコンテンツの作成者に尋ねるとしたら、何について尋ねますか？

2023年の最高のサイバーセキュリティニュースレター

サイバーセキュリティのニュースレターは、幅広いトピックをカバーし、さまざまな読者のニーズに対応していますこの分野で先を見越したいと思っている人にとって、非常に役立ちます

Matplotlibを使用してインフォグラフィックを作成する

データを扱い、データサイエンティストとして仕事をするためには、魅力的で興味深いデータの可視化を作成することが重要ですこれにより、読者に情報を簡潔な形式で提供することができ、理解を助けることができます

常に学習中 AIがデータ漏洩を防ぐ方法

この記事では、データ侵害を防ぐために人工知能の利用について議論しています人工知能が悪意のある活動を検出し、データのパターンを識別してフラグを立てることができる方法について説明しており、これによりセキュリティチームが脅威を軽減するための対策を取ることができます

Artificial Intelligence

生成AIは、製造業の進歩、自動化の向上、乗客の福祉と安全性の向上など、自動車産業を含むさまざまな分野で変革的な力として現れています。生成AIは、自動車の様々な側面を革新することができます。この記事では、現在と将来の車における生成AIのさまざまな応用について説明します。自動運転車（AV）生成AIの力を利用することで、仮想環境や現実的なシミュレーションの構築に役立つ画像やビデオを生成することができます。これにより、自動運転車（AV）は制御された環境内で学習し適応することができます。さらに、AVには信頼性の高いセンサーデータが大量に必要であり、生成AIモデルを使用することで、現実世界の状況を代表する合成データを生成することができます。これにより、高コストかつ時間のかかる現地テストの必要性をなくすことができます。また、大量のデータを生成することにより、生成AIは意思決定モデルのトレーニングに使用できる実用的なアルゴリズムの作成に役立ちます。ユーザーのパーソナライズ生成AIモデルは、ユーザーの好みを予測する能力を持っています。例えば、与えられたルートに基づいて好みのルートを予測し、オンラインマーケットプレイスを個別化し、サービスの推薦を提供する機械学習アルゴリズムなどがあります。さらに、この技術はユーザーのダッシュボードの設定に自動的に適応し、よく使用される機能がナビゲーションパネルでより目立つようになります。また、最も興味深い将来の応用の1つは、生成AIによって動力を得た車内パーソナルアシスタントです。これは、会話能力と包括的なサポートを備えた知能型のパーソナルアシスタントと考えることができます。マーケティング生成モデルは、マーケティングや広告における顧客エンゲージメントを革新し、より効果的な結果を生み出します。パワフルな生成AIツールであるJasperは、GPT-3上に構築されており、販売用メール、ブログ、ソーシャルメディアの投稿など、顧客中心のマーケティングコンテンツを簡単に生成します。一方、DALL-E 2などの画像生成モデルは、広告業界で人気を集めています。この革新的な技術は、従来のマーケティング予算から具体的な結果を得るのが難しい自動車会社にとって、有望な解決策を提供します。生成AIを使用することで、これらの企業はマーケティング投資をより効果的に追跡し最適化することができ、リソースの効率的かつ効果的な割り当てを確保することができます。製品開発自動車産業は数年にわたって10億ドル以上を製品開発に投資しており、生成AIはデザイン、開発、納品の段階の時間差を最小限に抑えることでコスト削減の機会を提供します。これは、データの合成、分析、パターン検出、結果の予測などの能力によって実現されます。予測メンテナンス生成AIはIoTと連携して予測メンテナンスを提供することができます。IoTシステムと統合された車の数が増えるにつれて、車両に埋め込まれたセンサーは車両の状態に関するリアルタイム情報を提供します。生成AIを活用することで、これらの膨大なデータセットを分析し、異常を検出し、車両のメンテナンスの必要性について的確な判断を行うことができます。自動車産業における生成AIの実際の例メルセデス・ベンツメルセデスはベータプログラムの一環としてGPTモデルを90万台の車に導入しました。このモデルは、会社の音声アシスタントを介してアクセスすることができ、ドライバーは目的地について問い合わせたり、新しい夕食のレシピの提案や複雑な質問に対する回答を求めたりすることができます。 BMW BMWは、生成AIをデザインプロセスに組み込んでおり、重量最適化、接続ポイント、負荷容量などの正確なデザイン仕様を考慮したAIモデルを活用しています。このモデルは、デザイン基準を満たす革新的で効率的かつ視覚的に魅力的な車両部品を幅広く生成し、新しいデザイン提案の開発に必要な時間を大幅に短縮すると同時に、デザイン要件の達成を保証します。トヨタトヨタリサーチインスティチュート（TRI）は、革新的な生成AI技術を導入して車両デザイナーの能力を向上させています。公開されているテキストから画像を生成する生成AIツールを活用することで、デザイナーは初期のデザインスケッチとエンジニアリングの制約を創造的なプロセスに取り入れることができます。この新しい技術により、デザインとエンジニアリングの考慮事項を調和させるために必要な反復を大幅に減らし、デザイナーにとってより効率的なワークフローを提供します。テスラ…

分析から実際の応用へ：顧客生涯価値の事例

データサイエンティスト、マーケター、あるいはデータリーダーであろうと、もし「顧客生涯価値」をGoogleで検索したことがあるなら、がっかりしたことでしょう私もかつてCLVを担当していた時に同じように感じました

SalesforceはXGen-7Bを導入：1.5Tトークンのために8Kシーケンス長でトレーニングされた新しい7B LLMを紹介します

最近の人工知能の技術的なブレークスルーにより、Large Language Models（LLMs）はますます一般的になっています。過去数年間、研究者たちは、これらのモデルを膨大な量のデータでトレーニングして、複雑な言語関連のタスクを解決するための急速な進歩を遂げてきました。これには、複雑な言語パターンの理解、連続した回答の生成などが含まれます。特に研究者や開発者の関心を引いている研究の1つは、LLMsの長文コンテンツの取り扱いにおける応用です。これらのタスクの例は、テキストの要約やコードの生成などの比較的単純なタスクから、タンパク質の構造予測や情報検索などのより複雑な問題の記述まで様々です。長いテキストのシーケンスには、段落、表、画像などさまざまな形式の情報が含まれているため、LLMsはこれらの要素を処理し理解するためにトレーニングされなければなりません。さらに、長距離の構造的依存関係を効果的に考慮することで、LLMsはテキストの異なる部分間の関連性を特定し、最も関連性の高い情報を抽出することができます。したがって、より広範な知識に触れることで、LLMsはユーザーのクエリにより正確で文脈に即した回答を提供することができます。しかし、数多くの潜在的なユースケースにもかかわらず、MetaのLLaMAからMosaicMLのMPT LLMモデルに至るまで、ほとんどのオープンソースのLLMsは、最大2Kトークンのシーケンスでトレーニングされています。この制限は、より長いシーケンスのモデリングにおいて大きな課題を提起します。さらに、モデルのスケーリングに関する以前の研究は、固定された計算予算が与えられた場合、トークン数が多いほど小さなモデルの方が大きなモデルよりも優れたパフォーマンスを発揮することを示しています。したがって、現在の進歩と課題に着想を受けて、Salesforce ResearchはXGen-7Bを導入し、1.5兆トークンの8Kシーケンス長でトレーニングされた一連の7B LLMsにおいて画期的な成果を上げました。このモデルシリーズには、4Kシーケンス長に対応するXGen-7B-4K-Base、8Kシーケンス長に対応するXGen-7B-8K-Base、および公開用の教育データでファインチューニングされたXGen-7B-8k-Instが含まれています（研究目的のみで公開されています）。これらのLLMsの注目すべき特徴は、XGenがMPT、Falcon、LLaMAなどといった同様のサイズの最先端のLLMsと比較して、標準のNLPベンチマークで同等または優れた結果を達成することです。この研究で使用されたXGen-7bモデルは、Salesforceの独自のライブラリJaxFormerを使用してトレーニングされました。このライブラリは、TPU-v4ハードウェアに最適化されたデータとモデルの並列処理を利用した、効率的なLLMのトレーニングを可能にします。トレーニングプロセスはLLaMAのガイドラインに従い、さらに2つの追加の調査を行いました。最初の調査は「損失スパイク」の理解に焦点を当てました。これは、トレーニング中に損失が突然一時的に増加する現象であり、明確な原因がない状態です。これらのスパイクの原因はまだ不明ですが、研究者は「順次回路の並列化」、「swish-GLUの使用」、「RMS-Normの使用」などがトレーニングの不安定性に寄与する可能性があると特定しました。2つ目の調査はシーケンス長に関連しています。自己注意の二次の計算量のため、より長いシーケンスでのトレーニングは計算コストが著しく増加するため、段階的なトレーニングアプローチが採用されました。トレーニングは最初にシーケンス長2kの800Bトークンから始まり、次にシーケンス長4kの400Bトークン、最後にシーケンス長8kの300Bトークンを対象としました。 XGen-7b 8kモデルの長い文脈の理解能力を評価するために、研究者たちは3つの主要なタスクで評価を行いました。それらのタスクは、長い対話生成、テキストの要約、および質問応答です。研究者は、対象のタスクの難しさに基づいて、インストラクションに調整されたモデルを使用しました。長い対話生成に関しては、AMIミーティングの要約、ForeverDreaming、およびTVMegaSiteの脚本の要約の3つのタスクを評価に使用しました。すべての指標において、XGen-7B-instモデルは他のいくつかのインストラクションに調整されたモデルと比較して最高のスコアを達成し、優れたパフォーマンスを示しました。長文の質問応答に関しては、研究者は物理学、工学、歴史、エンターテイメントなどさまざまなトピックをカバーするウィキペディアのドキュメントを基にChatGPTを使用して質問を生成しました。質問と元の文書の関連性、構成、および関連性に基づいて、256トークンのLLM生成された回答をGPT-4で評価しました。このシナリオでは、2kトークンに制限されたベースラインモデルに比べて、XGen-7B-8k-Instモデルのパフォーマンスが優れていることが示されました。テキストの要約に関しては、研究者は会議の会話と政府の報告書という2つの異なるドメインのデータセットを使用してXGen-7bモデルを評価しました。その結果、XGen-7bモデルはこれらのタスクで他のベースラインモデルを大幅に上回り、テキストの要約でも優れたパフォーマンスを発揮することが示されました。評価により、XGen-7bモデルは、長い文脈を理解する能力に優れており、長い対話生成、質問応答、テキスト要約など、さまざまなタスクで優れた性能を発揮しました。その性能は、他の指示に調整されたモデルやベースラインモデルを上回り、広範なテキスト文脈での理解力と連続した応答生成能力を示しています。ただし、その効果的さにもかかわらず、XGenモデルには制約があることが研究者によって認識されており、バイアスが免除されず、有害な応答を生成する可能性があります。これは、他の多くのAIモデルと共有する特徴です。Salesforce Researchはまた、コードをオープンソース化して、コミュニティが研究内容を探求できるようにしています。 SF BlogとGithub Linkをチェックしてください。最新のAI研究ニュース、素晴らしいAIプロジェクトなどを共有している25k+ ML SubReddit、Discord Channel、Email Newsletterにもぜひ参加してください。上記の記事に関する質問や見落としがある場合は、お気軽に[email protected]までメールでお問い合わせください。

Pythonを使用したウェブサイトモニタリングによるリアルタイムインサイトの強化

イントロダクションこのプロジェクトの目的は、複数のウェブサイトの変更をモニタリングし、追跡するプロセスを自動化するPythonプログラムを開発することです。Pythonを活用して、ウェブベースのコンテンツの変更を検出し、文書化する繊細な作業を効率化することを目指しています。リアルタイムのニュース追跡、即時の製品更新、競合分析を行うために、この能力は非常に貴重です。デジタルの世界が急速に変化する中で、ウェブサイトの変更を特定することは、持続的な認識と理解を保つために不可欠です。学習目標このプロジェクトの学習目標は、以下のコンポーネントをカバーすることです： BeautifulSoupやScrapyなどのPythonライブラリを使用したウェブスクレイピングの方法に関する知識を向上させる。効率的にウェブサイトから価値のあるデータを抽出し、HTMLの構造をナビゲートし、特定の要素を特定し、さまざまなコンテンツタイプを処理することを目指します。ウェブサイトのコンテンツの微妙な変化を特定するスキルを向上させる。新しくスクレイピングされたデータを既存の参照と比較して、挿入、削除、または変更を検出するための技術を学ぶことを目指します。また、これらの比較中に遭遇するさまざまなデータ形式と構造を処理することも目指します。ウェブサイトの更新を追跡するためにPythonの自動化機能を活用する。cronジョブやPythonのスケジューリングライブラリなどのスケジューリングメカニズムを使用して、データ収集を強化し、繰り返しのタスクを排除する予定です。 HTMLのアーキテクチャについて包括的な理解を開発する。HTMLドキュメントを効率的にナビゲートし、データ抽出中に重要な要素を特定し、ウェブサイトのレイアウトと構造の変更を効果的に管理することを目指します。データ操作技術を探索することにより、テキスト処理のスキルを向上させる。抽出したデータをクリーンアップし、洗練させ、データエンコーディングの複雑さに対処し、洞察に基づいた分析と多目的なレポートのためにデータを操作する方法を学びます。この記事は、データサイエンスのブログマラソンの一環として公開されました。プロジェクトの説明このプロジェクトでは、特定のウェブサイトの変更を監視し、カタログ化するためのPythonアプリケーションを作成することを目指しています。このアプリケーションには、以下の機能が組み込まれます：ウェブサイトのチェック：特定のコンテンツやセクションの更新を検出するために、割り当てられたウェブサイトを一貫して評価します。データの取得：ウェブスクレイピングの方法を使用して、テキスト、グラフィック、または関連データなど、必要な詳細をウェブサイトから抽出します。変更の特定：新しくスクレイピングされたデータを以前に保存されたデータと比較し、違いや変更箇所を特定します。通知メカニズム：変更が検出された場合にユーザーをリアルタイムに通知するアラートメカニズムを実装します。ログ記録：変更の詳細な記録を時間スタンプや変更の情報とともに保持します。このアプリケーションは、ユーザーの設定に基づいて、任意のウェブサイトと特定のコンテンツを監視するようにカスタマイズできます。期待される結果には、ウェブサイトの変更に関する直ちにアラートが含まれ、変更の性質とタイミングを理解するための包括的な変更記録が含まれます。問題の定義このプロジェクトの主な目的は、特定のウェブサイトの監視プロセスを効率化することです。Pythonアプリケーションを作成することで、興味のあるウェブサイトの変更を追跡し、カタログ化します。このツールは、ニュース記事、製品リスト、その他のウェブベースのコンテンツの最新の変更について、タイムリーな更新情報を提供します。この追跡プロセスを自動化することで、時間の節約とウェブサイトへの変更や追加に対する即時の認識が確保されます。アプローチこのプロジェクトを成功裏に実装するために、以下の手順に従う高レベルのアプローチを取ります：プロジェクトでは、BeautifulSoupやScrapyなどの強力なPythonライブラリを使用します。これらのライブラリを使用すると、ウェブサイトから情報を収集し、HTMLコンテンツを取捨選択することが容易になります。始めに、ウェブサイトから情報を取得してベースラインを作成します。このベンチマークデータは、後で変更を特定するのに役立ちます。入力データを設定されたベンチマークと照合して、新しい追加や変更を追跡することができます。テキストの比較やHTML構造の違いの分析など、さまざまな技術を使用する場合があります。…

Spotifyで学んだ初級データサイエンティストのための5つの重要なレッスン（パート1）

大学を卒業し、今はゲームを変えている成功者たちが集まる世界に飛び込んでいます確かに、あなたはまだその中の一人ではないかもしれませんが、あなたはまさに旅立ったばかりです

データサイエンスをより速く学ぶために、ChatGPTの使い方もしも既に上級者であっても

ChatGPTのようなAIツールを使用して、データサイエンスを簡単に学ぶための初心者向けガイド

Learn more about Search Results メール - Page 61