UA-44035539-1

ジャンル クラウド
講座名称 分散処理の基礎(Hadoop技術の基礎と応用)
受講期間 2日間
講座形式 講義/演習
講座概要 ビッグデータで使用されるHadoopの基礎を理解し、構成方法と構築・運用を学びます。
学習目標 ・ビッグデータとHadoopの関係を理解する。
・Hadoopの構成方法と特徴を理解する。
・データ処理アプリの作成方法・実行の把握をする。
使用教材 オリジナルテキスト
学習項目 1日目
《ビッグデータとHadoopの関係》
・ビッグデータとは
・Hadoopとは?
・HadoopとRDBMSの違い
・データのライフサイクル
・Hadoopのディストリビューションと導入方法
《Hadoopの構成と適用領域》
・Hadoopのシステム構成
・Hadoopで何が出来るか
・HDFS(分散ファイルシステム)
・MapReduceフレームワーク
・MapReduceのステージ(Map/Shuffle/Reduce)
・MapReduceの適用事例(アクセスログ)
《Hadoopクラスタの環境選定》
・Hadoopクラスタの構成の確認
・Hadoopクラスタの機器選定
・推奨されるシステム構築サイクル
・Hadoopとクラウド
《アプリケーション動作を通じたデータ処理の体験 》
・HDFSのコマンド
・処理の概要 ・処理データの準備
・アプリケーションの動作環境
・アプリケーション実行手順
・本日のまとめ
2日目
《Javaによるプログラミング/その他の言語によるプログラミング 》
・Javaによるアプリケーションの実装
・実装例 ・Hadoop Streamingとは
・Hadoop Streamingを使ったプログラミング
《Hadoop活用事例》
・適用事例(1) – アクセスログの解析
・適用事例(2) – GPSプローブデータの解析
・適用事例(3) – ECサイト購買データのクロス集計
前提条件 Linuxの基本コマンドを知っていることが望ましい(必須ではない)
受講対象 オープンデータ、ビッグデータに興味がある方
受講料金 お問い合わせください
開催日程 お問い合わせください
事務局 教育研修事業部
株式会社サートプロ www.certpro.jp
TEL:03-6276-1168 FAX:03-6276-1169
お問合せ course.certpro.jp/?page_id=63
Print Friendly
分散処理の基礎(Hadoop技術の基礎と応用)