
วิธีการสร้าง Dataset จาก CSV ใน QuickSight
この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。
ครั้งนี้ ผมจะมาแนะนำวิธีการสร้าง Dataset จาก CSV ใน QuickSight ซึ่งจะใช้แค่ไฟล์ CSV ที่ชื่อว่า Order ในการ Upload
สิ่งที่ต้องมี
ต้องสมัครบัญชี QuickSight ใน AWS ก่อน สามารถสมัครตามลิงก์ด้านล่างนี้ได้เลย
- การสมัครบัญชี QuickSight ใน AWS
ถ้าสมัครเรียบร้อยแล้ว สามารถเริ่มทำการสร้าง Dataset จาก CSV ได้เลย
วิธีการสร้าง Dataset จาก CSV
ในการ Upload ครั้งนี้ จะใช้ไฟล์ CSV ที่ชื่อว่าordersสามารถดาวน์โหลดไฟล์ได้ที่ orders.csv
ในส่วนหัวข้อบรรทัดที่ 1 (header) ที่อยู่ในไฟล์ Excel จะเปลี่ยนเป็น Field ของ QuickSight สีเขียวด้านซ้ายมือ และเนื้อหาข้อมูลจะแสดงในพื้นที่สีแดงด้านล่าง
QuickSight จะเปลี่ยนข้อมูลบรรทัดที่ 1 (header) ของ Excel เป็น Field ตัวอย่างเช่น id, customer_id, order_no และอื่นๆ เป็นต้น

ทีนี้เราจะมาเริ่มต้นการสร้าง Dataset กัน โดยเลือกDatasetsและคลิกNew dataset

เลือกUpload a file

ไปที่เก็บไฟล์ของคุณ ไฟล์ของผมจะอยู่ที่Downloads

คลิกEdit settings and prepare data

นี่คือหน้าตาของ Edit settings and prepare data ที่เป็นของ Order ที่ได้ Upload มาเมื่อสักครู่นี้
เราสามารถทำการตั้งค่า หรือกำหนดค่าต่างๆ ในหน้านี้ได้ เช่นการเพิ่มไฟล์, การ Join Data, การ Exclude field หรือ Include field เป็นต้น

วิธีการเปลี่ยน Data Type
ก่อนที่จะทำการเปลี่ยน Data Type ต้องทำความเข้าใจก่อน จึงจะสามารถเลือกประเภทให้เหมาะสมกับ Field ที่เราจะใช้เก็บข้อมูลได้
ข้อมูลที่ทำการโหลดเข้ามาแล้วในแต่ละ Field นั้น ระบบจะตั้งค่า Data Type โดยอัตโนมัติ
Data Type มีอยู่ 4 ประเภทหลักๆ
1. Integer (การเก็บข้อมูลแบบตัวเลข)
2. Decimal (การเก็บข้อมูลตัวเลขที่มีจุดทศนิยม)
3. String (การเก็บข้อมูลแบบตัวอักษร)
4. Date (การเก็บข้อมูลแบบวันที่)
การเปลี่ยน Data Type สามารถทำได้ 2 วิธีดังนี้
① การเปลี่ยน Data Type ในช่อง Dataset
เลือก Field ที่ต้องการเปลี่ยน Data Type ในตัวอย่างคือจะเปลี่ยน order_no จาก Integer เป็น Decimal จากนั้นคลิกที่Integer

คลิกที่Decimal

จะเห็นว่า Data Type ของ order_no เปลี่ยนเป็น Decimal แล้ว

② การเปลี่ยน Data Type ในช่อง Fields
คลิกที่⋯ตามด้วยเลือกChange data type ﹥และเลือกDecimal

การเปลี่ยน Data Type เราต้องเลือกประเภทให้เหมาะสมกับ Field ที่เราจะใช้เก็บข้อมูล เช่นถ้า order_type เก็บข้อมูลเป็นตัวอักษร ก็ต้องใช้ String

แต่ถ้าเราเปลี่ยน Data Type ของ order_type จาก String เป็น Integer ก็จะเกิด Error เหมือนกับรูปภาพ

การ Exclude field และ Include field
Exclude field คือ การนำ field นั้นๆ ออกจากการแสดงผลข้อมูลในตาราง ในกรณีที่เราไม่ต้องการใช้งาน field นั้น
Include field คือ การนำ field ที่ต้องการแสดงผลมาเปิดการใช้งาน
ผมจะใช้ Field ที่ชื่อว่าcostมายกตัวอย่างในการ Exclude field และ Include field ในกรณีต่างๆ
ในกรณีที่ไม่ต้องการใช้งาน cost
ให้ดูที่ Field ด้านขวามือ จะเห็นว่ามีข้อมูลแสดงอยู่ จากนั้นให้คลิกที่⋯ของไฟล์costตามด้วยเลือกExclude field

จะเห็นว่าcostลงมาอยู่ในช่องของ Exclude field และให้ดูที่ตารางด้านขวามือ จะเห็นว่าข้อมูลcostได้หายไปแล้ว

ในกรณีที่ต้องการนำ cost กลับมาใช้งาน
ให้คลิกที่⋯ของไฟล์costตามด้วยเลือกInclude field

จะเห็นว่าcostกลับขึ้นมาอยู่ในช่องของ Fields แล้ว ทีนี้ให้ดูที่ตารางด้านขวามือ จะเห็นว่ามีข้อมูลของcostกลับมาด้วย
ถ้าทำการตั้งค่าเสร็จเรียบร้อยทั้งหมดแล้ว ให้คลิกที่Save and PublishและCancelได้เลย

เพียงเท่านี้เราก็ได้ Dataset ที่ชื่อว่าOrdersของเรามาแล้ว

สรุป
เราสามารถ upload ไฟล์ CSV หรือไฟล์อื่นๆ เข้ามายัง Dataset เพื่อใช้ในการสร้าง Dashboards ให้สามารถวิเคราะห์ข้อมูลเชิงลึกที่ต้องการได้








