コンピュータビジョンクラシックブックの推奨事項

コンピュータビジョンは人工知能の一分野であり、主に機械を「見る」方法の科学を研究します。一般的に、人間の目の代わりにカメラとコンピュータを使用してオブジェクトを認識、追跡、測定します。コンピュータ処理は、画像を検出するために観察または機器に送信する人間の目。

ドローン技術の分野でのコンピュータービジョンの応用も、多くの優れた事例を生み出しました。コンピュータービジョンをよりよく学び、深く理解する方法は?Amu Labは本日、読む価値のあるコンピュータービジョンに関する古典的な本をいくつかお勧めします。

1.包括的な記事

1.「コンピュータビジョン:アルゴリズムとアプリケーション」   

 著者:リチャード・シェリスキ

コンピュータビジョンテクノロジの初心者(学部生)は、さまざまな標準的なコンピュータビジョンの問題に対する強固な基盤を提供します。この本は、ワシントン大学でこの主題を教えた長年の経験に基づいてリチャードによって書かれました。具体的なトピックには、イメージング、画像処理、特徴検出、マッチングとセグメンテーション、特徴ベースの位置合わせ、モーションベースの構造再構成、画像貼り付け、計算写真、ステレオ位置合わせ、3次元再構成、画像ベースのレンダリングと認識などが含まれます。著者はまた、線形代数、数値最適化手法、ベイズモデリング、およびコンピュータービジョンアルゴリズムに関連する推論を提供します。

2.「コンピュータビジョン:最新の方法」

著者:フォーサイス(デビッドA.フォーサイス)/パークシ(ジャンポンス)

この本の内容には、幾何学的カメラモデル、照明とカラーリング、色、線形フィルタリング、ローカル画像の特徴、テクスチャ、ステレオ相対、モーション構造、クラスターセグメンテーション、組み合わせとモデルのフィッティング、追跡、登録、滑らかな表面とスケルトン、距離データが含まれます、画像分類、オブジェクトの検出と認識、画像ベースのモデリングとレンダリング、ヒューマノイド研究、画像検索と検索、最適化技術など。

2.ジオメトリ

1.「コンピュータビジョンにおけるマルチビュージオメトリ」

作者:リチャード・ハートリー/アンドリュー・ジサーマン

実世界を理解するために使用される三次元構造は、コンピュータビジョンの分野における根本的な問題です。内容には、3次元幾何学の計算と再構成、およびオブジェクトの代数式に関連する幾何学の原則が含まれています。この本は、統一されたフレームワークの形でシーン再構築の理論と実装の詳細を提供します。同時に、著者は詳細な背景知識、アプリケーション、および実装アルゴリズムの説明も提供します。

2.《 3Dビジョンへの招待》

作者:Yi Ma / Stefano Soatto /JanaKosecká/ S。Shankar Sastry

この本は、コンピュータビジョンの重要な問題に焦点を当てています。線形代数と行列理論を使用して、一連の2次元画像から3次元構造と動きを再構築します。この本の特徴は、幾何学を研究し、複数の画像に基づいて幾何学モデルを再構築するための統一されたフレームワークです。また、画像形成、基本的な画像処理方法、特徴抽出が含まれています。また、視覚的アルゴリズムとシステム操作の実装についても説明します。

3.「コンピュータビジョン:計算理論とアルゴリズムの基礎」 

著者:MA Song、Zhang Zhengyou

この本は、情報処理のレベルから視覚情報の認知過程までのコンピュータビジョンの研究、ならびに視覚情報処理の計算理論、表現、および計算方法について説明しています。この本は、画像特徴抽出、カメラキャリブレーション、ステレオビジョン、モーションビジョン(またはシーケンス画像分析)、画像のグレーレベルから3次元オブジェクトの形状を復元する方法、オブジェクトなど、コンピュータビジョンの重要な理論とアルゴリズムを体系的に紹介しています。モデリングと認識の方法および距離画像分析の方法。

3つのOpenCV記事

1.《 OpenCV 3を学ぶ》

著者:エイドリアン・ケイラー/ゲイリー・ブラツキー

この本の焦点は、opencvライブラリ、おそらく最高のオープンソースコンピュータビジョンライブラリの使用方法を教えることです。すべてのコード例はC ++であり、ターゲットオーディエンスがコンピュータービジョンをプロジェクトに適用する方法を学びたいプロの開発者であることを示しています。

2.「OpenCVチュートリアル」

著者:Rui Zhen / Shiqi YU Abstract

この本は、中国でOpenCVを完全に紹介し、OpenCVオープンソースコンピュータービジョンライブラリの詳細な説明を提供する最初の中国語の本です。OpenCVは一連のC関数とC ++クラスで構成されており、その関数は画像処理、コンピュータービジョン、パターン認識の分野をカバーしています。OpenCVは、画像処理、構造解析、動き検出、カメラキャリブレーション、3次元再構成、機械学習などを含む多数の一般的なアルゴリズムを実装しており、高い運用効率を備えています。この本のすべての例は、C / C ++言語のソースコードを提供します。

第四に、画像処理とパターン認識

1.「デジタル画像処理」

著者:ゴンザレス、Ruanqiu Qi(翻訳済み)

この本は12の章、すなわち、紹介、デジタル画像の基礎、グレースケール変換と空間フィルタリング、周波数領域フィルタリング、画像の復元と再構成、カラー画像処理、ウェーブレットと多重解像度処理などで構成されています。

2.「パターン認識」 

著者:Edge Zhao Qi、Zhangの労働者

この教科書では、監視パターン認識におけるベイジアン決定理論、確率密度関数推定、線形判別関数、非線形判別関数、最近傍法、特徴選択、抽出など、パターン認識の基本概念と代表的な方法について体系的に説明しています。認識およびモデルベースの方法、混合密度推定、動的クラスタリング方法、階層的クラスタリング方法など。対応する章には、人工ニューラルネットワーク、サポートベクターマシン、決定ツリーとランダムフォレスト、ロジャース回帰、B00sting法、ファジーパターンが含まれます。パターン認識の分野における認識およびその他の新しいコンテンツ。全体的なコンテンツの配置は、体系的かつ実用的であるように努めており、現在の研究の最前線の一部をカバーしています。

3.「モデル分類」 

著者:リチャードO.デュダ

パターン認識とシーン分析の分野における基本的な古典。主に統計的パターン認識と構造的パターン認識、およびニューラルネットワーク、機械学習、データマイニング、進化的計算、不変理論、隠れたマルコフモデル、統計的学習理論、サポートなど、過去25年間の多くの新しい理論と新しい方法について説明します。ベクターマシンなど

5、機械学習

1。《コンピュータビジョン:モデル、学習、推論》

著者:サイモンJDプリンス

この本は、コンピュータビジョンの問題を解決するための確率モデルの学習と推論の方法を紹介し、3次元構造の推定など、観測画像と推定対象のコンテンツとの関係を確立するためのトレーニングデータの使用方法について説明します。この本には、確率、確率グラフモデル、グラフセグメンテーション方法、マルチビジョンジオメトリ、カメラキャリブレーション、顔認識、ターゲット追跡などの基本的な知識が含まれています。この本では70以上のアルゴリズムが紹介されています。

2.《パターン認識と機械学習》 

著者:クリストファービショップ

この本は、ベイズの観点からパターン認識を説明する最初の本であり、グラフィカルモデルを使用して離散確率分布を説明します。内容には、線形回帰モデル、線形分類モデル、ニューラルネットワーク、カーネル法、スパースカーネル法、グラフモデル、混合モデルと期待値最大化アルゴリズム、近似推論、サンプリング法、連続潜在変数モデルなどが含まれます。

3.「ディープラーニング」 

作者:イアン・グッドフェロー、ヨシュア・ベンジオ、アーロン・クールヴィル

この本は3つのパートで構成されています。最初のパートでは基本的な数学ツールと機械学習の概念を紹介し、2番目のパートでは最も有名なディープラーニングアルゴリズムについて説明し、3番目のパートではディープラーニング研究の最先端のアイデアと問題をリストします。

4.《一般化された主成分分析》

En:RenéVidal、Yi Ma、Shankar Sastry

この本は、ノイズ、大きなエラー、または異常を含む可能性のある1つ以上のサブスペースまたはマニフォールドから生成された高次元データをモデル化するための数学的理論と計算の最新の開発を紹介し、サブスペース推定の使用と最新の代数的、幾何学的、およびセグメンテーションの統計計算方法、および画像処理、画像とビデオのセグメンテーション、顔認識、クラスタリングにおけるいくつかの興味深いアプリケーションが提供されています。

ドローン技術の乾物の詳細については、WeChatパブリックアカウントの「AmuLab」をフォローしてください。学習コースの詳細については、「AmuCommunity」をフォローしてください。
コミュニティフォーラムのアドレス:bbs.amovauto.comディスカッションに参加してください。

おすすめ

転載: blog.csdn.net/msq19895070/article/details/106554048