DEHA のAIチームは画像処理をどう実施しているか?

ベトナムには画像処理といえば、「チームのメンバーは全員フォトショップの専門家」だと思う人が多くあるのではないだろうか。

しかし、「Computer Vision」というのはベトナム人達が英語を「画像処理」に翻訳したことのせいで、フォトショップ専門家の仕事と同じことと勘違いしてしまいました。

それでは、Computer Visionという言葉は正確にどういう意味を持っていますか?簡単に言えば、「コンピュータ視覚」(略:コンピュータビジョン)で定義されています。

でも、「コンピュータには視覚を与える?」と思う人がいるようですね。一番広く公表される定義によると、「コンピュータを用いた視覚(Vision)の実現を研究する学術分野です」の内容になっていることです。

つまり、コンピュータビションはある「画像データ」を用いて何らかの処理を行い、人間の視覚と同じ視覚処理を実現します。または、静止画もしくは動画を入力データとして使い、人間の視覚のようなものをコンピュータのソフトウェアで実現するというのがコンピュータビジョンという分野です。

I/ DEHAのAIチームのメンバー紹介

●Son HS: ハノイ工科大学の数学・情報学応用学部、コンピュータービジョン専門家

●Hieu NT: ハノイ工科大学ー情報技術開発学部

●Tuan HV: ハノイ土木大学ー情報技術開発学部

●Trong DHV: アメリカのTexas A&M大学ーコンピュータサイエンス学部、インターンシップ

●Bien HG: ハノイオープン大学ー情報技術開発学部

II/ コンピュータービジョンへの応用

●対象認証: ヒト・モノ・動物

●人物検知・追跡

●顔識別・表情・行動解析

。。。

上記の機能で、コンピュータビジョンは実際に多くの分野にて応用されています。

III/ AIチームはコンピュータビジョンプロジェクをどう開発しているか? 

他のプロジェクトと同様にお客様からの要件を基にして開発します。

しかし、これらの要件は良く曖昧で、要件内容の全部は一文中しかない場合もあります。

お客様の要件を分析・理解した後、プロジェクトがどんなに処理されるか検討します。普通に下記のようないくつかのタイプがあります。

●トラッキング

●検知

●認証

プロジェクトがどんなタイプかを確認してから、チームメンバーから出された提案・技術の可能性を評価します。

プロジェクトに適応可能な提案という確証を提供するように、AIに関連する参考資料・ドキュメントなどを読み込んで、研究します。

最も適用性が高い提案を決めてから、メンバーに担当部分を割り当てます。

チームの一番必要な任務はプロトタイプの作成が行えるように、選択されたアルゴリズミック・方法をインプリメントします。

これらのプロトタイプはPythonとOpenCV (コンピュータビジョンをサポートするオープンソースのフレームワーク)で構築されます。

プロトタイプだと言っても、インプリメント活動は下記の順番を遵守しなければなりません。 

●サンプルデータ取得

●サンプルデータの前処理

●デバイスが処理されること

●結果取得 

「デバイスが処理されること」のステップには多くのアルゴリズミックを使わなかればなりません。それの理由はコンピュータビジョンに対して、複雑な問題が発生する時Machine Learning(機械学習)のサポートが必要なので、多くアルゴリズミック・モデル・Machine Learning(機械学習)のパラメータを試まないといけないことです。それに、展開作業の試みが時間かかるので、

Machine Learning(機械学習)のパフォーマンスをちゃんと検討する必要があります。

Machine Learning(機械学習)パターン・コンピュータビジョンのアルゴリズミックを決めた後、最適なプロトタイプも作成されます。今まで、次の作業は製品の効能の問題を検討することになります。

現在、Machine Learning(機械学習)あるいは、コンピュータビジョンを研究する時、簡単な実施・早めに結果が出る特徴を持つために、多くの人がPython 言語を取り使いますが、実際にPython言語は処理速度が遅くて、コンピュータビジョンのシステムパフォーマンスに強くないです。この問題を理解することによって、私AIチームはPythonでのプロトタイプを完了してから、アルゴリズミックやMachine Learning(機械学習)のモデルなどをより強いーCまたはC++の言語に変換することにします。最後のはお客様に高品質な製品を提供することです。

IV/ チームの困難は何だろうか?

コンピュータビジョンとMachine Learning(機械学習)分野は長い間に研究・発展されていますが、コンピューターサイエンス中にかなり難しいことも認められています。開発者は数学・アルゴリズミック・高い効能プログラミングに深い知識を持つことです。それに、高いレベル・コンフィギュレーションのデバイスも必要があります。現在、新メンバーの能力と開発用の出費もまだ限定されています。

それらの困難を乗り越えて、AIチームがお客に納品を提供しました。

メンバー全員の勤勉と熱心で、将来的に品質が高くて、お客様からの満足を貰えることを動力・確信にして、いつも前向きな姿勢をします。