RSS Dropbox Tech Blog ノート

RSS Dropbox Tech Blog

Dropbox Techウェブサイトは、Dropboxが技術とエンジニアリングの話、洞察、イノベーションを共有するプラットフォームです。このウェブサイトには、Dropboxのエンジニアと開発者が書いた記事やブログポストが掲載されており、ソフトウェア開発、データストレージ、セキュリティなど、多くのトピックをカバーしています。 このウェブサイトは、ブログ、ポッドキャスト、オープンソースプロジェクトのセクションに分かれています。ブログセクションには、技術的なトピックに関する詳細な記事が掲載されており、Dropboxが特定の技術的な課題に対処する方法、新しい技術やツール、過去のプロジェクトからの教訓などが含まれています。 ポッドキャストセクションには、Dropboxのエンジニアと他の業界の専門家との会話が収録されており、技術のトレンド、イノベーション、ソフトウェア開発の未来などを話題にしています。 オープンソースセクションでは、Dropboxが特定の問題を解決するために開発されたツールやライブラリがGitHub上で公開されています。これらのプロジェクトには、Dropboxのエンジニアが開発したものが含まれており、特定の問題を解決するために使用されたり、特定のプロセスを改善するために使用されます。 総のところ、Dropbox Techウェブサイトは、開発者、エンジニア、テクノロジーとソフトウェア開発に興味がある人々にとって非常に有益なリソースです。このウェブサイトは、成功したテック企業の内部の動作を一目で見ることができ、テック業界のさまざまな分野で適用できる洞察や知識を提供します。

ノートのスレッド

コード生成を超えて:AIエージェント時代のエンジニアリング生産性の再考

Dropboxが、エンジニアを支援するAIツールから、スコープされたタスクを実行できるエージェンティックシステムへと移行する方法、そしてそれらのワークフローをサポートするプラットフォームをどのように構築しているか。
CdXz5zHNQW_3ss3I0ppge.png

コーディングエージェント向け社内プラットフォーム、Novaをご紹介します。

Novaは、エンジニアが複数のコーディングセッションを並行して実行できるようにし、内部システムが自動化されたワークフローの一部としてAIエージェントを使用できるようにします。
CdXz5zHNQW_uegoIwWkP4.png

DSPyでDashの関連性判断を最適化した方法

私たちはDSPyを使って、関連性評価のためのプロンプトエンジニアリングを、測定可能で自動化された最適化ループに変え、タスクのパフォーマンス、コスト、そして本番環境での信頼性を向上させました。
CdXz5zHNQW_0eQF46aSDL.png

Dropbox チーム向けの端末間暗号化の実装

チーム向けの端末間暗号化の実装、デザインの脅威モデル、暗号化アルゴリズム、チーム中心の鍵管理アプローチでデータ損失のリスクを最小化することにコミットメントすることについて、より多くの情報を学びます。

さようならさようならさようなら...: ChatGPT モデルの反復トークン攻撃の進化

これまでのプロンプト・インジェクション研究に基づいて、最近、OpenAIのチャット・コンプレーション・モデルに関する新しいトレーニング・データ・エクストラクション・脆弱性を発見しました。

これが日付か? ファイル名の日付形式を特定するためのMLの使用

この記事は、Dropboxがファイル名の日付形式を特定するための機械学習モデルを実装したことを話題にしています。このモデルは、ファイルの組織化と検索を向上させるものです。効果的なファイル命名は、チームワークのために非常に重要です。Dropboxの自動的な命名規則機能により、ユーザーはファイル名のルールを設定し、整合性と効率を確保することができます。 はじめ、Dropboxはルールベースのアプローチで日付の特定を試みましたが、異なる個人によって使用される日付形式の多様さに挑戦しました。このため、ファイル名内の日付を正確に認識する機械学習モデルが開発されました。このモデルは、データのアノテーション、トークン化、分類の複数の段階を経験し、Inside-Outside-Beginning (IOB) タギングなどの技術を使用して日付コンポーネントをラベル付けしました。 Transformerアーキテクチャー(特にDistilRoberta)に基づく機械学習モデルは、以前のルールベースのシステムよりも大きな改善を示し、名前変更されたファイルの数を40%増加させました。パフォーマンスの最適化のために、Dropboxはモデルプルーニングや量子化などの技術を実装し、推論時のレイテンシを減らすことに成功しました。 2022年8月のロールアウト後、機能は人気を博し、ローンチ直後には100万以上のファイルが名前変更されました。将来的には、日付以外のエンティティの抽出や、ファイル命名規則の精度向上のために高度なモデルを活用することが予想されます。