JPLは、マルウェア研究を支援するためのPDFアーカイブを作成しました

JPL created a PDF archive to support malware research.

The Digital Corpora project hosts the huge data archive as part of Amazon Web Services’ Open Data Sponsorship Program, and the files have been packaged in easily downloadable zip files. ¶ Credit: Science RF/Adobe

アメリカ航空宇宙局のジェット推進研究所(JPL)のデータサイエンティストたちは、オンラインセキュリティの向上を目的として、800万のPDFファイルをオープンソースアーカイブにまとめました。

このコーパスは、Defense Advanced Research Projects Agency(DARPA)のセーフドキュメントプログラムの一部です。

専門家は、このアーカイブを見て、ファイルのコードに隠されているかもしれないマルウェアに関する情報を見つけ、新興のオンライン脅威を予測し、PDFテクノロジーを拡張することができます。

研究者たちは、Webクロールデータの公開リポジトリであるCommon Crawlを使用して、コーパスに含めるPDFを特定しました。また、専用のソフトウェアを使用して、切り詰められたファイルを再取得しました。

約8テラバイトのデータセットは、そのようなタイプの中で最大の公開コーパスです。 Jet Propulsion Laboratoryからのフル記事を表示

要約の著作権は、2023年SmithBucklin、ワシントンDC、米国に帰属します。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more