ข้อมูลที่จัดเป็น บิ๊กดาต้า ประกอบด้วยข้อมูลอะไรบ้าง คุณสมบัติของ Big Data นั้น จะมีลักษณะโดยรวมอยู่ 6 ประการด้วยกัน หรือที่มีการพูดถึงในชื่อ “5Vs 1C” โดยคุณลักษณะทั้ง 6 ของ Big Data นั้น มีดังนี้
1. ข้อมูลที่มีปริมาณมาก (Volume)
หมายถึง มีปริมาณข้อมูลอยู่มาก มีขนาดใหญ่ สามารถนับรวมได้ทั้งข้อมูลแบบออนไลน์และแบบออฟไลน์ โดยข้อมูลต้องมีขนาดใหญ่เกินกว่า Terabyte
ยกตัวอย่างเช่น การเข้าถึงอินเทอร์เน็ตของประชากรทั่วโลกที่มีจำนวนเพิ่มมากขึ้นทุกปี ซึ่งแต่ละคนมีพฤติกรรมการใช้งานข้อมูลที่หลากหลาย ทำให้ปริมาณของข้อมูลที่เกิดขึ้นมีจำนวนมหาศาล
2. ข้อมูลที่มีความหลากหลาย (Variety)
หมายถึง ข้อมูลแต่ละชนิดนั้นมีความหลากหลาย รวมกันทั้งรูปแบบมีโครงสร้าง ไม่มีโครงสร้าง และกึ่งโครงสร้าง
ยกตัวอย่างผ่านพฤติกรรมของ Social Media User ที่ในแต่ละวันสามารถสร้างชุดข้อมูลได้หลากหลาย เช่น การคอมเมนต์ลงในโพสต์ทาง Facebook จัดเป็นข้อมูลแบบไม่มีโครงสร้าง เพราะไม่สามารถคาดเดาคำตอบและโพสต์ที่เขาสนใจจากคอมเมนต์ได้
หรือการโพสต์ลงบน Twitter ที่สามารถจัด Category ของแต่ละโพสต์ผ่าน Hashtag ได้ แต่ก็ไม่สามารถระบุโครงสร้างหรือความหมายของ Hashtag นั้นได้อย่างชัดเจน นี่จึงจัดเป็นข้อมูลกึ่งโครงสร้าง
ส่วนข้อมูลที่ได้จากการตอบแบบสอบถามผ่าน Google Form ที่มีคำถามและคำตอบให้เลือกอย่างชัดเจน และข้อมูลนั้นสามารถนำไปใช้ต่อได้เลยทันที จะจัดว่าเป็นชุดข้อมูลแบบมีโครงสร้าง
เนื่องจากการใช้งานของ Social Media User นั้นไม่ได้เป็นระเบียบแบบแผนตายตัว ทำให้นอกจากมีปริมาณข้อมูลเกิดขึ้นอย่างมหาศาลแล้ว ข้อมูลเหล่านั้นยังเต็มไปด้วยความหลากหลายและซับซ้อนอีกด้วย
3. ข้อมูลที่มีการเพิ่มขึ้นอย่างรวดเร็ว (Velocity)
หมายถึง ข้อมูลที่มีการเพิ่มขึ้นและเกิดความเปลี่ยนแปลงอย่างรวดเร็ว ทำให้เกิดข้อมูลแบบ Real-time มากมาย อย่างเช่นข้อมูลการจราจร ซึ่ง Google Map ก็ได้ใช้ประโยชน์จากการเข้าถึง GPS ของผู้ที่สัญจรไปมาบนท้องถนน เพื่อวิเคราะห์และนำเสนอเส้นทางที่การจราจรคล่องตัวที่สุดให้กับผู้ใช้งาน
4. ข้อมูลที่สร้างประโยชน์นำไปใช้ในทางธุรกิจได้ (Value)
หมายถึง ข้อมูลที่มีคุณค่าต่อการนำไปใช้งาน สามารถก่อให้เกิดประโยชน์ทางธุรกิจได้เป็นอย่างดี ยกตัวอย่างเช่น พฤติกรรมการค้นหาข้อมูลผ่าน Google ที่ทำให้สามารถทราบถึงความสนใจของผู้คนในช่วงเวลานั้นๆ ได้
5. ข้อมูลต้องมีความถูกต้องชัดเจน (Veracity)
เนื่องจาก Big Data นั้นรวบรวมข้อมูลไว้เป็นจำนวนมหาศาล เพราะฉะนั้น สิ่งที่สำคัญที่สุดก็คือความถูกต้องชัดเจนของข้อมูล ซึ่งจะเป็นส่วนสำคัญที่จะสามารถนำข้อมูลเหล่านั้นมาประมวลผลเพื่อการใช้งานต่อในอนาคตได้
6. ข้อมูลต้องมีความเชื่อมโยงกัน (Complexity)
การจะใช้ประโยชน์จาก Big Data ได้นั้น มีอีกหนึ่งปัจจัยสำคัญนั่นก็คือความเชื่อมโยงกันของข้อมูล หากสิ่งที่รวบรวมมานั้นไม่สามารถหาจุดเชื่อมโยงกันได้ ข้อมูลเหล่านั้นก็ไร้ประโยชน์ การเก็บ Data ที่มีประสิทธิภาพนั้นจึงต้องคำนึงถึงความสัมพันธ์กันของข้อมูลด้วย
ข้อมูลที่จัดเป็น Big Data ประกอบด้วยข้อมูลอะไรบ้าง
-ข้อมูลประเภทมีรูปแบบและโครงสร้าง เช่น ข้อมูลด้านตัวเลข สถิติ สามารถบอกแจ้งอย่างเป็นรูปธรรม เป็นจำนวนหรือปริมาณวัดได้
-ข้อมูลประเภทนามธรรม ไม่ได้มีโครงสร้างหรือรูปแบบ ข้อมูลกลุ่มนี้ อาจเป็นข้อมูลการสนทนาโต้ตอบ การสร้างปฏิสัมพันธ์ในสังคมโซเชียล อย่าง Facebook , instragram, twitter หรือแม้กระทั่งในรูปแบบของวิดีโอ
-ข้อมูลที่เป็น Big Data เป็นข้อมูลดิบ อาจเป็นข้อมูลตรงขององค์กร หรือได้รับจากภายนอกที่องค์กรมีปฏิสัมพันธ์ด้วย เช่น กลุ่มคู่ค้า เครือข่ายเน็ตเวิร์ค แต่สิ่งที่เหมือนกันก็คือ ข้อมูลเหล่านั้น ต้องนำมาวิเคราะห์ก่อนนำไปใช้สร้างมูลค่าทางธุรกิจ