Even G2の要約に死角があった——「会話が入り乱れる会議」でやらかした話

ウェアラブルAI
SNSフォローボタン
物欲オジ(ブツオジ)の暴走を見守りたい方はフォロー

このブログは、アラフィフの物欲オジことブツオジが気になったAIガジェットに片っ端から突っ込んでいく”浅堀り体験ブログ”です。
本日のテーマはEven G2の要約機能の「死角」。文字起こし無料無制限の破壊力を絶賛した直後に気づいた、正直な話をします。


結論

Even G2の要約は、話者が少なく進行が整理された会議には強い。でも複数人が入り乱れて会話の応酬になる会議では、誰が何を言ったかが180°ズレることがある。これはツールの仕組みの問題で、使い方でカバーするしかない。前回の記事でEven G2の文字起こし無料無制限を絶賛したばかりだが、正直に書いておく。

★★★あわせて読みたいこの記事↓↓↓★★★

メモをやめた話と、Even G2無料の破壊力——NotePinsを忘れた日に気づいたこと
「ちゃんとメモしろ」世代がAI要約を信頼してメモをやめた。NotePinsを忘れた日にEven G2の書き出し機能を本格起動したら文字起こし無料無制限の破壊力に気づいた。ただし100%は信用できない理由もある。


Even G2の要約、どう動いているか(ブツオジの理解)

まず前提の話をしておきたい。

Even G2の文字起こしは、音声そのものを解析してリアルタイムで話者を判定しているわけではない(と、ブツオジは理解している)。録音された音を文字に起こし、そのテキストを元に構造化・話者推定をしている、というプロセスだ。

つまり「誰がしゃべったか」の判断が、テキストの流れや文脈から推定される。会話の内容・文体・話題の切り替わりから、AIが「これはAさんの発言っぽい」「この返しはBさんだろう」と判断していく、そういうやり方だ。

これは別に欠陥ではない。そのやり方で十分機能するシーンが確かにある。問題は、機能しないシーンがあるということだ。


「整理された会議」と「入り乱れる会議」は別物だった

ここで気づいたのは、会議には大きく2種類あるということだ。

Even G2の要約が機能しやすい会議

アジェンダがある。発言者が1〜2名中心で進む。質疑は「では次にどうぞ」みたいなターン制に近い。報告→確認→次へ、の流れが繰り返される。よくある定例の打ち合わせ、上司への進捗報告、1on1みたいな場面がこれにあたる。

Even G2の要約が苦手な会議

複数人が入り乱れる。誰かの発言に誰かが即座に返す。議論が白熱して「でもそれって〜」「いや待って〜」みたいな応酬が続く。話者がくるくる変わる。ブレスト系、問題解決系、感情が入った調整系の会議がこれにあたる。

テキストの流れから話者を推定するやり方では、この後者に弱い。会話の応酬が激しいほど、どの発言がどの人のものか、テキストだけでは判断しづらくなるからだ。


やらかした話

先日、プロジェクトの方向性を複数人で詰める、わりと白熱した会議があった。

Even G2をかけていた。文字起こしは動いていた。会議後に吐き出されたテキストをAIに投げて要約させた。

返ってきた要約を読んで、最初は「あれ?」と思った。

「Aさんがこの案に強く反対した」という記述があった。でも実際の会議で強く反対していたのはBさんで、Aさんは逆に推進派だったはずだ。

読み進めると、他にも発言者がひっくり返っているらしい箇所がいくつかある。細かい内容は合っているのに、誰が言ったかが違う。結果として、要約上の「Aさん」と「Bさん」の立場が実際と逆転していた。

これが「180°ズレる」という感覚だ。

事実誤認として議事録に残ったらまずい。というか、そもそも議事録として使えない。


PLAUD AIと比べると、確かに違う

正直、NotePin SのPLAUD AIではこういうことが起きた記憶がない。あるいは起きていても気づいていないだけかもしれない。断言はできない。でも「確実に起こりにくい」とは言える感触がある。

★★★あわせて読みたいこの記事↓↓↓★★★

NotePin S レビューまとめ前半戦の記録|衝動買いから迷走まで、オジの全軌跡を振り返る
AIウェアラブル「NotePin S」を購入してから約1ヶ月。会議・授業参観・比較検証・バンド交換・きり忘れ問題まで、アラフィフ物欲オジが体当たりで試した前半戦の全記録をまとめました。買おうか迷っている人もどうぞ。

理由は推測になるが、PLAUD AIは音声データそのものを解析して話者識別をしている可能性が高い。声の高さ・リズム・周波数といった音響的な特徴から「これはAさんの声」「これはBさんの声」と判断するやり方だ。

音から直接判断できるなら、テキストの文脈に頼る必要がない。会話の応酬になっても、声が違えば話者が違うとわかる。

Even G2の「文字起こし無料無制限」という強みは本物だ。でもその恩恵は、テキストベースの要約という仕組みの上に成り立っている。そこには確かに死角がある。


使い分けの結論

整理するとこういうことだ。

Even G2が向いている会議

  • アジェンダ進行型、発言者が少ない
  • 定例・報告・1on1
  • 「多少ズレても流れがわかればいい」という用途

NotePin S(PLAUD AI)が向いている会議

  • 複数人が入り乱れる議論系・調整系
  • 話者の発言内容が重要で正確性が必要な場面
  • 公式の議事録として残すもの

「重要度が高いからNotePin S」という単純な話ではなくて、会議の構造によって向き不向きがある、というのが今のブツオジの理解だ。

ライトな定例会議はEven G2で十分。でも人間関係や意思決定が絡むような会議は、NotePin Sをバックアップに使う。その棲み分けが現実的だと思っている。

文字起こし無料無制限の破壊力は本物だ。使う場所を間違えなければ、の話だけど。


浅堀り担当なので深掘りはしないけど、そういうことです。


★ あわせて読みたい

にほんブログ村 オヤジ日記ブログ アラフィフオヤジへ
にほんブログ村

コメント

タイトルとURLをコピーしました