業務活用はどう進む?
生成AIを業務に活用する動きが進む中、まずは自分の業務で試してみることが大切だと感じています。たとえば、直近ではOpenAIの新しいモデルに関して、ハルシネーション率が高いとされるため、o4-miniを使ってその数値を表にまとめる取り組みを行いました。
混在は何故起こる?
しかし、OpenAIのモデルであるにもかかわらず、GPT-4o-miniとo4-miniが混在した表が作成され、そのままでは利用できない結果となりました。ベンチマークでは高いスコアが出ているものの、正確性の面では改善の余地があると実感しました。
試行の価値は?
また、生成AIは手軽に試すことができるため、積極的に利用する価値があると感じています。さらに、AIエージェントやGraph RAGといった技術も提案されており、これらを自分自身で実践することが重要だと改めて認識しました。