AWS Summitレポート記事内の箇条書きメモを元にNotionAIで読み取れるレポート文が生成できるか試してみた #NotionAI

イベントのメモを取る場合には箇条書きになりやすいものですが、そこから自力でレポート文を起こすのは案外骨が折れる作業です。丁度AWS Summitの記事が多数上がっていて、かつ箇条書きでの内容が多かったので、NotionAIによって生成できるレポートがどれほどのものなのか試してみました。
2023.04.24

配信等のリアルタイムイベント中に書くメモは都合上どうしても敬称等略した箇条書きとなりやすいでしょう。私もYouTubeでの生配信時にメモを書き起こす場合によく経験しています。等で後々キーフレーズ等を読み返したい場合はそれでも十分に機能するものですが、問題はそれら箇条書きを元にレポートとしたい場合。

箇条書きを元にレポートとして書き起こすのはそれなりに手間が掛かる代物ですが、そんなときこそのNotion AIです。丁度AWS Summitにて速報性を最優先に、箇条書きでのレポートが多く上がっているため、それらを題材に実際どの程度通用するレポートができるか試してみました。

利用した記事について

以下の記事となります。今回の原稿を書いている最中に一番最新で上がっていたレポートだったというだけで、それ以外で全く他意はありません。

尚、単にレポートとして起こしただけだと「実は全く違う文として整形されていた」という可能性もあるので、一文ずつ精査していきます。

Notion AIで箇条書きからレポートを起こしてみる

カスタムAIブロックに投げた文章は箇条書きメモを元にレポートを起こしてとなります。生成されたレポート内容については以下の通り。

Data-Centric とは、データの品質などに注力して開発するアプローチです。一方で Model-Centric アプローチでは、機械学習の選択やパラメータのチューニングに注力します。Data-Centric アプローチを採用することによって、データをきれいにすることができます。そして、綺麗なデータと汚いデータで10%精度が違う場合があるとされています。

機械学習プロジェクトが失敗する理由の一つには、データの品質が不十分なことや、データサイエンティストなどの専門職が不在であることが挙げられます。プロジェクト成功に導くワークフローを構築するためには、機械学習の知識、高速な試行錯誤、差別化要素への注力が必要です。特に、差別化要素への注力は、より重要になっているとされています。

機械学習プロジェクトは、データ処理、モデル開発、デプロイの3つのステップから構成されます。そして、Data-Centric アプローチを採用することによって、データ処理のステップでサイクルを高速化することができます。ただし、Data-Centric アプローチは、1つの有効なアプローチであるとされていますが、銀の弾丸ではありません。

Amazon SageMaker によって、構造化データパターン(テーブルデータ)と非構造化データパターン(画像、文書、音声など)に対する機械学習のデータ処理、モデル開発、デプロイが可能になっています。具体的には、SageMaker Data Wrangler を使った機械学習用のデータの準備や、SageMaker Autopilot を使った完全可視性を備えた機械学習モデルの自動作成、SageMaker Ground Truth を使った機械学習向けの高品質なデータセット作成、SageMaker JumpStart を使った素早い学習とデプロイが可能です。

チェックする

段落毎に進めていきます。

まず確認すべき項目としてはData-Centric アプローチとModel-Centric でしょう。文中では比較のように扱われていますが、念の為`Data-Centric vs Model-Centric`にてGoogle等で検索してみると多数ヒットするため、ずれはないようです。

次に、機械学習プロジェクトが失敗する理由からの書き出しとなっています。これは機械学習ワークフローと Data-Centricの項目途中から拾い出されており、失敗した事例を元に成功する道筋を建てるという書き方のようです。差別化要素への注力に関する記述は補足部分を元にしたピックアップですね。

機械学習プロジェクトの構成に関する段落は、Data-Centric を採用するメリットとしての書き出しとなっています。

Amazon SageMaker に関する段落は、これまでに上げた機械学習プロジェクトの詳細を元に、SageMakerを利用するメリットを上げています。

全般的に文章としては成り立っていますが、各段落が何を指しているのか見出しも合わせて作ってもらったほうが内容を汲み取りやすそうです。

ということで段落毎の見出しも追加で生成してもらいました。それほどずれてはなさそうです。

  • Data-Centric とは
  • 機械学習プロジェクトが失敗する理由
  • 機械学習プロジェクトの構成
  • Amazon SageMaker による解決

あとがき

箇条書きからのレポート起こしを自力でやるのは中々骨が折れる作業なのですが、NotionAIは文意も汲み取りつつ、強調したい箇所は適切に強調してくれつつ、読み取れる文章として出してくれるのでとても便利です。

勿論、箇条書きの内容については裏付けが取れていることが前提です。誤った内容が含まれていた場合はレポート自体の価値もなくなってしまいます。

箇条書きからの文章起こしで長く時間を使っている場合にはNotionAIを併用することで効率のよく進められるのではと思います。