Data-Centric AI｜AI用語集｜AI・人工知能の本を探すなら

Data-Centric AIは、AIモデルの性能向上を目的として、モデルそのものではなく、学習データの質と量を体系的に改善していくアプローチです。

従来のModel-Centric AIが、固定されたデータセットに対して最適なモデルアーキテクチャやハイパーパラメータを探索することに重点を置いていたのに対し、Data-Centric AIでは、より良い学習データを構築することで、多様なモデルが安定して高い性能を発揮することを目指します。

具体的には、データの収集、ラベリング、クリーニング、増強、そしてバイアス修正といったプロセスに注力します。

例えば、ノイズを含むデータや誤ったラベル付けがされているデータを除去したり、データの偏りを是正するために特定のカテゴリのデータを追加で収集したりします。

また、画像認識タスクであれば、回転や反転といったデータ拡張（Data Augmentation）を適用することで、モデルの汎化能力を高めます。

このアプローチは、特に実世界の複雑な問題や、大規模なデータセットの管理が困難な状況において有効です。高品質なデータは、モデルのロバスト性や公平性を向上させ、AIシステム全体の信頼性を高める上で不可欠な要素となります。

Data-Centric AIは、AI開発におけるパラダイムシフトであり、持続可能なAIシステムの構築に貢献する重要な概念です。