目次

使用した環境ジョブをデザインするジョブを作成する実行してみるまとめ

[Talend] DBからデータを抽出してS3へPutする

TalendでETL処理をつくっちゃおう

「カスタマーストーリー」を支えるツール特集

#ビッグデータ

津熊弘和

2016.07.07

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

データ分析基盤構築においてありがちな連携パターンのサンプルジョブですが、作ってみました。

使用した環境

Talend Open Studio 6.1 for MACOS

読み出し元D/B：仮想OS上のWindows7 on MySQL5.5

ジョブをデザインする

流れとしては

MySQLへのコネクションコンポーネント( tMysqlConnection )
MySQLからデータを抽出するコンポーネント（ tMysqlInput ）
クエリ結果をファイルに書き出すコンポーネント（ tFileoutputDelimited ）
S3へのコネクションコンポーネント（ tS3Connection ）
S3へファイルを配置するコンポーネント（ tS3Put ）

この５つのコンポーネントを使用してジョブを作成します。エラー処理とかも本来は必要ですが、ここでは割愛して正常系のみを想定して作成します。

ジョブを作成する

１．まずは各コンポーネントをペインにドラッグ＆ドロップで配置します。

２．配置したあとは処理の流れを想定して、コンポーネントの位置を整えます（見栄え良くコンポーネントを配置する）

３．関係線を定義します。

４．tMysqlConnectionのプロパティを設定します。

５．tMysqlInputのプロパティを設定します。『既存の接続を使用』にチェックし、tMysqlConnection_1が選択されていることを確認し、select対象のテーブル名を指定します。あとはクエリを書いて終了です。（ここでは全件を取得する "select * from customers" にします。）

６．tFileOutputDelimitedでファイルを書き出すためのスキーマを定義する

書き出すファイルの位置と区切り文字や改行コード及びヘッダーを含む等を適切に指定します。

次にMySQL上のcumtomersテーブルのデータを確認します。（customersテーブルは下記のような感じで作成しています）

上記のテーブルのデータをファイルに書き出したいのでtFileOutputDelimitedの『スキーマの編集』で定義します。

入力スキーマで定義が終わったら全選択後、オレンジ枠で囲んでいる部分の矢印クリックで出力スキーマにコピーし、最後にOKをクリックします。

７．tS3Connectionのプロパティを設定します。

Access Key と Secret Key を適切なもので設定します。

８．tS3Putのプロパティを設定します。

※しばらく使ってないといつも Key に指定するのってなんだっけ？ってなるのですが、S3にPutする時のファイル名を指定します。

これでジョブ作成は完了です。

tMysqlInputコンポーネントでビックリマークが出てる場合は

のようにスキーマ編集でDBタイプを指定すればビックリマークが消えると思います。

実行してみる

S3のバケットが空であることを確認。

実行してみます。

エラーもなく実行が終わったので、S３にファイルがアップされているかを確認します。

問題なくS3へファイルがアップされていることが確認できました。

まとめ

基本的にはRedshiftにロードする場合はS3経由が前提となりますので、必要に応じてtFileOutputDelimitedのプロパティにてUTF8への文字コードで書き出しを行う必要がありますしファイルを圧縮する方が効率が良いので、必要に応じてプロパティで『zipファイルに圧縮』にチェックすることも必要になりますが、基本はDBから抽出しS3へアップロード、copyコマンドでRedshiftへロードという流れは変わりませんので、ちょっと検証とかで試してみたいとかであれば使えるかなとは思います。

Share this article

関連記事

แนะนำ Amazon WorkSpaces Family ประจำปี 2025

แนะนำ Amazon WorkSpaces Family ประจำปี 2025

kan-jittapramoulboon

2025.07.11

Amazon Q Developer CLIで英単語アプリを作ってもらってみた

Amazon Q Developer CLIで英単語アプリを作ってもらってみた

2025.07.11

Amazon Q Developer CLIにAWSアカウントを調査・操作させてみた

Amazon Q Developer CLIにAWSアカウントを調査・操作させてみた

2025.07.11

Amazon Connect Customer Profilesを利用せず、アウトバウンドキャンペーンを実行する方法

Amazon Connect Customer Profilesを利用せず、アウトバウンドキャンペーンを実行する方法

2025.07.11

クラスメソッド株式会社

主なカテゴリ

お問い合わせ

クラスメソッドへの問い合わせ

DevelopersIOへのご意見

AWSに関するご相談

資料ダウンロード

メールマガジン登録

セミナー情報

会社説明会

運営会社

クラスメソッドについて

DevelopersIOとは

AWS支援サービス一覧

公式X(Twitter)

アクセス情報

プライバシーポリシー

クッキーポリシー

© Classmethod, Inc. All rights reserved.