วิธีการสร้าง Dataset จาก CSV ใน QuickSight

วิธีการสร้าง Dataset จาก CSV ใน QuickSight เป็นการนำข้อมูลที่อยู่ในไฟล์ CSV มาวิเคราะห์ข้อมูลเชิงลึกผ่านแดชบอร์ดได้

ครั้งนี้ ผมจะมาแนะนำวิธีการสร้าง Dataset จาก CSV ใน QuickSight ซึ่งจะใช้แค่ไฟล์ CSV ที่ชื่อว่า Order ในการ Upload

สิ่งที่ต้องมี

ต้องสมัครบัญชี QuickSight ใน AWS ก่อน สามารถสมัครตามลิงก์ด้านล่างนี้ได้เลย

วิธีการสร้าง Dataset จาก CSV

ในการ Upload ครั้งนี้ จะใช้ไฟล์ CSV ที่ชื่อว่าordersสามารถดาวน์โหลดไฟล์ได้ที่ orders.csv

ในส่วนหัวข้อบรรทัดที่ 1 (header) ที่อยู่ในไฟล์ Excel จะเปลี่ยนเป็น Field ของ QuickSight สีเขียวด้านซ้ายมือ และเนื้อหาข้อมูลจะแสดงในพื้นที่สีแดงด้านล่าง

QuickSight จะเปลี่ยนข้อมูลบรรทัดที่ 1 (header) ของ Excel เป็น Field ตัวอย่างเช่น id, customer_id, order_no และอื่นๆ เป็นต้น
QuickSight_field-data-fix-2

ทีนี้เราจะมาเริ่มต้นการสร้าง Dataset กัน โดยเลือกDatasetsและคลิกNew dataset
Datasets-1

เลือกUpload a file
Datasets-2

ไปที่เก็บไฟล์ของคุณ ไฟล์ของผมจะอยู่ที่Downloads
Datasets-3

คลิกEdit settings and prepare data
Datasets-4

นี่คือหน้าตาของ Edit settings and prepare data ที่เป็นของ Order ที่ได้ Upload มาเมื่อสักครู่นี้

เราสามารถทำการตั้งค่า หรือกำหนดค่าต่างๆ ในหน้านี้ได้ เช่นการเพิ่มไฟล์, การ Join Data, การ Exclude field หรือ Include field เป็นต้น
Datasets-5

วิธีการเปลี่ยน Data Type

ก่อนที่จะทำการเปลี่ยน Data Type ต้องทำความเข้าใจก่อน จึงจะสามารถเลือกประเภทให้เหมาะสมกับ Field ที่เราจะใช้เก็บข้อมูลได้

ข้อมูลที่ทำการโหลดเข้ามาแล้วในแต่ละ Field นั้น ระบบจะตั้งค่า Data Type โดยอัตโนมัติ
Data Type มีอยู่ 4 ประเภทหลักๆ
1. Integer (การเก็บข้อมูลแบบตัวเลข)
2. Decimal (การเก็บข้อมูลตัวเลขที่มีจุดทศนิยม)
3. String (การเก็บข้อมูลแบบตัวอักษร)
4. Date (การเก็บข้อมูลแบบวันที่)

การเปลี่ยน Data Type สามารถทำได้ 2 วิธีดังนี้
การเปลี่ยน Data Type ในช่อง Dataset
เลือก Field ที่ต้องการเปลี่ยน Data Type ในตัวอย่างคือจะเปลี่ยน order_no จาก Integer เป็น Decimal จากนั้นคลิกที่Integer
change-fields-o-1

คลิกที่Decimal
change-fields-o-2

จะเห็นว่า Data Type ของ order_no เปลี่ยนเป็น Decimal แล้ว
change-fields-o-3

การเปลี่ยน Data Type ในช่อง Fields
คลิกที่ตามด้วยเลือกChange data type ﹥และเลือกDecimal
change-fields-o-4

การเปลี่ยน Data Type เราต้องเลือกประเภทให้เหมาะสมกับ Field ที่เราจะใช้เก็บข้อมูล เช่นถ้า order_type เก็บข้อมูลเป็นตัวอักษร ก็ต้องใช้ String
error-type-1

แต่ถ้าเราเปลี่ยน Data Type ของ order_type จาก String เป็น Integer ก็จะเกิด Error เหมือนกับรูปภาพ
error-type-2

การ Exclude field และ Include field

Exclude field คือ การนำ field นั้นๆ ออกจากการแสดงผลข้อมูลในตาราง ในกรณีที่เราไม่ต้องการใช้งาน field นั้น
Include field คือ การนำ field ที่ต้องการแสดงผลมาเปิดการใช้งาน

ผมจะใช้ Field ที่ชื่อว่าcostมายกตัวอย่างในการ Exclude field และ Include field ในกรณีต่างๆ

ในกรณีที่ไม่ต้องการใช้งาน cost
ให้ดูที่ Field ด้านขวามือ จะเห็นว่ามีข้อมูลแสดงอยู่ จากนั้นให้คลิกที่ของไฟล์costตามด้วยเลือกExclude field
Exclude-cost-1

จะเห็นว่าcostลงมาอยู่ในช่องของ Exclude field และให้ดูที่ตารางด้านขวามือ จะเห็นว่าข้อมูลcostได้หายไปแล้ว
Exclude-cost-2

ในกรณีที่ต้องการนำ cost กลับมาใช้งาน
ให้คลิกที่ของไฟล์costตามด้วยเลือกInclude field
Datasets-8

จะเห็นว่าcostกลับขึ้นมาอยู่ในช่องของ Fields แล้ว ทีนี้ให้ดูที่ตารางด้านขวามือ จะเห็นว่ามีข้อมูลของcostกลับมาด้วย

ถ้าทำการตั้งค่าเสร็จเรียบร้อยทั้งหมดแล้ว ให้คลิกที่Save and PublishและCancelได้เลย
Datasets-9-fix

เพียงเท่านี้เราก็ได้ Dataset ที่ชื่อว่าOrdersของเรามาแล้ว
Datasets-10

สรุป

เราสามารถ upload ไฟล์ CSV หรือไฟล์อื่นๆ เข้ามายัง Dataset เพื่อใช้ในการสร้าง Dashboards ให้สามารถวิเคราะห์ข้อมูลเชิงลึกที่ต้องการได้

บทความที่เกี่ยวข้อง

ดูรายละเอียดเพิ่มเติมได้ที่นี่ สอบถามเพิ่มเติมเกี่ยวกับ AWS คลิกที่นี่