この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。
当エントリは『Amazon QuickSight Advent Calendar 2016』の22本目のエントリです。
昨日の21本目のエントリは『ドリルダウンをビジュアルに追加』でした。
『AWS re:Invent 2016』の直前に一般利用可能となったAWSによるBIサービス、Amazon QuickSight。発表されたばかりですが、早速Amazon QuickSightを使い倒すべく色々な切り口でその内容について見て行きたいと思います。
22本目となる当エントリでは、Amazon QuickSightにおける『データソースに関する制限』について見て行きたいと思います。
Amazon QuickSightで扱うデータソースには以下の制限事項が存在します。
ファイルに関する制限
- SPICEにインポートするファイルのサイズは1GB以下である必要があります。これはローカルファイル及びS3にアップロードされているファイルいずれの場合も該当します。
- また、対象のデータソースがS3の場合、マニフェストファイルで指定しているファイルのサイズが合計で10GBを超えてはいけません。ファイルの数についても、合計で100個を超えては行けません。
- ファイルのカラム数は200、1行あたりの桁数については25400までとなっています。この合計桁数を超えていない限り、フィールド間で文字がどのように分配されるかについては関係ありません(ちなみにフィールド長の制限は511桁となっています)。
テーブルとクエリに関する制限
SPICEに取り込むテーブルまたはクエリの結果セットのサイズは10GBまでとなっています。もしもっと多くのデータを扱いたいという場合はSQLクエリを使って結果セットのサイズを減らすようにしてください。
項目に関する制限
SPICEに取り込むデータセットの項目桁数の上限は511桁となっています。
サポートされているデータ型について
Amazon QuickSightでは現在、以下のプリミティブなデータ型をサポートしています。
- 日付(Date):
- サポートされている日付形式のいずれかでなければなりません。
- 小数(Decimal):
- 小数点データ型は小数点以下4桁までをサポートします。これより大きなスケールの値についてはSPICEへのインポート時に小数第4位まで切り捨てられます。例)13.00049→13:0004
- データ準備中に上記条件に合致するデータを使用する計算フィールドについては、計算実行時には完全な値を使用します。計算結果については小数第4位で切り捨てられる形となります。詳細については以下をご参照ください。
- Working with Calculated Fields - Amazon QuickSight
- 整数(Integer):
- 文字列(String):
データソースとして使用するテーブルまたはファイルに、これらのデータ型に暗黙的に変換出来ないフィールド(例えば地理空間データ型を使用するフィールド)が含まれていない事を確認します。Amazon QuickSightでは変換できないデータ行についてはスキップします。
以下はデータソース別のサポートされているデータ型一覧です。Boolean型についてはAmazon QuickSightでは整数に変換されます。
DBエンジン・ データソース | 数値型 | 文字列型 | 日付時刻型 | 真偽型 |
---|---|---|---|---|
Amazon Aurora MariaDB MySQL | bigint decimal double int integer mediumint numeric smallint tinyint | binary blob char enum set text varbinary varchar | date datetime timestamp year | |
PostgreSQL | bigint decimal double integer numeric precision real smallint | char character text varchar varying character | date timestamp | boolean |
SQL Server | bigint bit decimal int money numeric real smallint smallmoney tinyint | char nchar nvarchar text varchar | date datetime datetime2 datetimeoffset smalldatetime |
サポートされていないデータ値について
フィールドに、Amazon QuickSightがフィールドに割り当てるデータ型に準拠しない値が含まれている場合、それらの値を含む行はスキップされます。 たとえば、次のソースデータがあるとします。
Sales ID Sales Date Sales Amount
--------------------------------------
001 10/14/2015 12.43
002 5/3/2012 25.00
003 Unknown 18.17
004 3/8/2009 86.02
Amazon QuickSightは、Sales Dateを日付フィールドとして解釈し、日付以外の値を含む行を削除するため、次の行だけがインポートされます。
Sales ID Sales Date Sales Amount
--------------------------------------
001 10/14/2015 12.43
002 5/3/2012 25.00
004 3/8/2009 86.02
また、データベース・フィールドに、ソース・データベース・エンジン用のJDBCドライバで解釈できない値が含まれている場合、解釈不能な値はnullに置き換えられ、行をインポートできます。 この問題の唯一の既知の事実は、MySQLのdate、datetime、およびtimestampフィールドがすべて0の値を持つことです(0000-00-00 00:00:00など)。 たとえば、次のソースデータがあるとします。
Sales ID Sales Date Sales Amount
---------------------------------------------------
001 2004-10-12 09:14:27 12.43
002 2012-04-07 12:59:03 25.00
003 0000-00-00 00:00:00 18.17
004 2015-09-30 01:41:19 86.02
次のデータがインポートされます。
Sales ID Sales Date Sales Amount
---------------------------------------------------
001 2004-10-12 09:14:27 12.43
002 2012-04-07 12:59:03 25.00
003 (null) 18.17
004 2015-09-30 01:41:19 86.02
タイムゾーンの扱いについて
Amazon QuickSightは、日付データのクエリ、フィルタリング、および表示にUTC時間を使用します。
日付データでタイムゾーンが指定されていない場合、Amazon QuickSightはUTC値を仮定します。 日付データでタイムゾーンが指定されている場合、Amazon QuickSightはそれをUTC時刻に変換して変換します。 たとえば、2015-11-01T03:00:00-08:00のようなタイムゾーンオフセットの日付フィールドは、UTCに変換され、2015-11-01T11:00:00としてAmazon QuickSightに表示されます。
サポートされている日付フォーマット
日付フィールドのデータは、次のいずれかの形式でなければなりません。 形式は、Jodaプロジェクトのドキュメントの Class DateTimeFormatで説明されているパターン構文を使用して指定します。
1.yyyy-MM-dd, for example 2015-10-01.
2.yyyy-MM-ddTHH, for example 2015-10-01T16.
3.yyyy-MM-ddTHH:mm, for example 2015-10-01T16:08.
4.yyyy-MM-ddTHH:mm:ss, for example 2015-10-01T16:08:29.
5.yyyy-MM-ddTHH:mm:ss.SSS, for example 2015-10-01T16:08:29.322.
6.yyyy-MM-ddTHH:mm:ss,SSS, for example 2015-10-01T16:08:29,322.
7.yyyy-MM, for example 2015-10.
8.yyyy-MM-ddTHH:mm:ss.SSSZZ, for example 2015-10-01T16:08:29.322-08:00.
9.yyyy-MM-ddTHH:mm:ss,SSSZZ, for example 2015-10-01T16:08:29,322-08:00.
10.yyyy-MM-ddTHH:mm:ssZZ, for example 2015-10-01T16:08:29-08:00.
11.yyyy-DDD, for example 2015-066.
12.yyyy-DDDTHH:mm:ss.SSSZZ, for example 2015-066T16:08:29.322-08:00.
13.yyyy-DDDTHH:mm:ssZZ, for example 2015-066T16:08:29-08:00.
14.yyyy-MM-dd HH:mm:ss.SSS, for example 2015-10-01 16:08:29,322.
15.yyyy-MM-dd HH:mm:ss, for example 2015-10-01 16:08:29.
16.yyyyMMdd, for example 20151001.
17.yyyyMMddTHHmmss.SSSZ, for example 20151001T160829.322-0800.
18.yyyyMMddTHHmmssZ, for example 20151001T160829-0800.
19.yyyyDDD, for example 2015066.
20.yyyyDDDTHHmmss.SSSZ, for example 2015066T160829.322-0800.
21.yyyyDDDTHHmmssZ, for example 2015066T160829-0800.
22.yyyy, for example 2015.
23.yyyy/MM/dd HH:mm:ss, for example 2015/10/01 16:08:29.
24.yyyy/MM/dd, for example 2015/10/01.
25.MM/dd/yyyy, for example 10/01/2015.
26.MM/dd/yy, for example 10/01/15.
27.M/d/yyyy, for example 1/1/2015.
28.M/d/yy, for example 1/1/15.
29.MM/dd/yyyy HH:mm:ss, for example 10/01/2015 16:08:29.
30.MM/dd/yy h:mm a, for example 10/01/15 4:08 PM.
31.MM/dd/yy HH:mm:ss, for example 10/01/15 16:08:29.
32.MM/dd/yy HH:mm, for example 10/01/15 16:08.
33.MM/dd/yy hh:mm a, for example 10/01/15 04:08 PM.
34.MMM dd, for example Oct 01.
35.MMM dd yyyy HH:mm:ss, for example Oct 01 2015 16:08:29.
まとめ
という訳で『Amazon QuickSight Advent Calendar 2016』22本目、『データソースに関する制限』に関するご紹介でした。明日もお楽しみに!