ผู้ใช้:Busarin/กระบะทราย
นี่คือหน้าทดลองเขียนของ Busarin หน้าทดลองเขียนเป็นหน้าย่อยของหน้าผู้ใช้ ซึ่งผู้ใช้มีไว้ทดลองเขียนหรือไว้พัฒนาหน้าต่าง ๆ แต่นี่ไม่ใช่หน้าบทความสารานุกรม ทดลองเขียนได้ที่นี่ หน้าทดลองเขียนอื่น ๆ: หน้าทดลองเขียนหลัก |
Big Data:3V
- หลายๆคนยังเข้าใจว่า Big Data คือการที่มีข้อมูลดิจิตอลขนาดมหาศาล แต่จริงๆแล้วเรามักจะนิยามความหมายของ Big Data ด้วยคำย่อว่า 3V
- โดยประกอบไปด้วย
1.Volume คือมืจำนวนข้อมูลมากเกินกว่าระบบฐานข้อมูลแบบเดิมๆจะสามารถที่จะจัดการได้
2.Velocity คือข้อมูลจะมีการเปลี่ยนแปลงอย่างรวดเร็ว เช่นข้อมูลจาก Social Media ข้อมูลการซื้อขาย ข้อมูล Transaction การเงินหรือการใช้โทรศัพท์ หรือข้อมูลจาก Senso
3.Variety คือข้อมูลจะมีหลากหลายรูปแบบทั้ง Structure และ Unstructure ซึ่งอาจจะอยู่ในรูปทั้ง RDBMS, text, XML, JSON หรือ Image
ทำไมต้องมาสนใจ Big Data
จะเห็นได้ว่าในยุคปัจจุบัน มีการใช้อุปกรณ์ประเภทสมาร์ทโฟนและแท็บเลทกันอย่างแพร่หลาย มี Application ที่ถูกพัฒนามาเพื่อสนับสนุน Platform ดังกล่าวมากมาย รวมถึงความนิยมในการใช้ Social Network และการทำธุรกิจหรือธุรกรรมออนไลน์ต่างๆ ทำให้มีข้อมูลเกิดขึ้นในระบบออนไลน์เหล่านี้เป็นจำนวนมาก และอยู่ในรูปแบบ Unstructured การจัดการกับข้อมูลจำนวนมากและเกิดขึ้นตลอดเวลาประเภทนี้ ไม่สามารถทำได้ด้วยวิธีการจัดเก็บไว้ใน Database รูปแบบเดิมๆ ได้ดี หรือถ้าทำได้ก็ไม่สะดวกสบายนัก และการจะนำมาใช้ให้เกิดประโยชน์ก็ยาก ดังนั้นองค์กรต่างๆ ส่วนมากจึงมักจะมีแต่การจัดเก็บสะสมไปเรื่อยๆแต่ไม่ได้มีการนำมาใช้งานใดๆ สุดท้ายก็เป็นเหมือนขยะกองโตขององค์กร ที่สิ้นเปลืองทรัพยากรในการเก็บรักษาหรือไม่ก็ถูกปล่อยให้สูญหายไปอย่างไร้ค่า ทั้งที่จริงแล้ว ถ้ามีการจัดเก็บและนำมาวิเคราะห์ให้ดี จะพบว่าข้อมูลเหล่านี้เปรียบเสมือนขุมทรัพย์ที่จะทำให้ธุรกิจเติบโตได้อย่างมาก เพราะอุดมไปด้วยข้อมูลที่หลากหลาย สามารถนำมาสร้างมูลค่าเพิ่มให้กับองค์กรได้ในหลายๆ มุมมอง รวมถึงสามารถนำข้อมูลที่ได้มาใช้เพื่อการป้องกันหรือปิดช่องโหว่ที่มีอยู่ในทั้งระบบออนไลน์และระบบภายในขององค์กรได้ และหากมีเครื่องมือที่เหมาะสมก็ยิ่งจะช่วยให้การนำข้อมูลออนไลน์มาใช้ในการดำเนินธุรกิจนั้นเกิดประสิทธิภาพในการวิเคราะห์ข้อมูลจนสามารถนำมาใช้ประโยชน์ได้ดียิ่งขึ้น ทำให้เกิดมุมมองใหม่ๆ สามารถมองเห็นในสิ่งที่คู่แข่งยังมองไม่เห็นหรือไม่ได้ใส่ใจที่จะนำมาใช้ ทำให้องค์กรของเราได้เปรียบหรือมีความเหนือชั้นกว่าในการดำเนินธุรกิจ และมีโอกาสประสบความสำเร็จมากกว่า ยกตัวอย่างบริษัทที่นำ Big Data เข้ามาใช้งานและสร้างความเติบโตให้องค์กรจนประสบความสำเร็จจนสามารถอยู่ในกลุ่มผู้นำของธุรกิจ อาทิเช่น Google , Facebook ,Twitter ,Yahoo เป็นต้น
ตอนนี้ถ้าองค์กรมีความสนใจที่จะนำ Big Data เข้ามาใช้ อาจจะกำลังสงสัยว่าจะจัดการกับข้อมูลประเภทนี้ได้อย่างไร ดังที่ได้เกริ่นไว้แล้วแต่แรกว่าไม่สามารถจัดการ Big Data ได้ด้วยระบบ Database แบบเดิมๆ เนื่องด้วยข้อมูลมีปริมาณมากเกินที่จะรับได้ และรูปแบบก็มีความหลากหลายเกินไป ดังนั้น จึงจำเป็นต้องใช้ระบบการเก็บข้อมูลหรือการประมวลผลในรูปแบบอื่นๆ เข้ามาช่วยจัดการแทนระบบแบบเดิมๆ ซึ่งการจัดการกับ Big Data นั้น ณ ปัจจุบันมีเครื่องมือที่ได้รับความนิยมอย่างแพร่หลายและมีชื่อเสียงตัวหนึ่งเข้ามาช่วยจัดการ นั่นคือ Hadoop ที่พัฒนามาจาก Open Source Technology ให้ทำหน้าที่เป็น Distributed Storage ที่สามารถเก็บข้อมูลขนาดใหญ่ที่เป็น Unstructured และนำมาประมวลผลได้ ซึ่งองค์ประกอบหลักๆ ของ Hadoop ประกอบด้วย
- Hadoop Distributed File System (HDFS) ที่ทำหน้าที่เป็น Storage จัดเก็บข้อมูลให้อยู่ในรูปแบบที่เหมาะสมพร้อมใช้งาน
- Map Reduce ใช้ในการพัฒนาโปรแกรมเพื่อประมวลผลให้ได้ผลลัพธ์ตามต้องการ ด้วยการเข้าถึงข้อมูลอย่างรวดเร็ว
นอกจาก Hadoop แล้วยังมี Software อื่นๆ ที่มาช่วยเสริมการทำงานของ Hadoop ให้มีประสิทธิภาพมากยิ่งขึ้นในการทำงานร่วมกับฐานข้อมูลเดิมขององค์กร เช่น Sqoop หรือ Hive เป็นต้น รวมถึง Splunk ซึ่งสามารถนำมา Integrate ร่วมกับ Hadoop เพื่อให้สามารถทำงานทำได้สะดวก มี Dashboard ที่สามารถทำการค้นหาข้อมูลเชิงลึกได้แบบ Real-Time แล้วนำมาผลที่ได้มาแสดงให้อยู่ในรูปแบบของกราฟฟิคที่สวยงามดูง่าย สำหรับเรื่องราวของ Hadoop และ Splunk นั้นทางบิ๊กฟิชฯ จะขอนำไปกล่าวถึงไว้ในบทความฉบับหน้า ซึ่งท่านผู้อ่านสามารถติดตามได้จากเว็ปไซต์ของบริษัทฯ สุดท้ายนี้ถ้าจะให้กล่าวโดยสรุปสำหรับเทคโนโลยี Big Data ก็คือ การนำข้อมูลที่มีปริมาณมากๆ มาผ่านการประมวลผล การวิเคราะห์ และแสดงผลด้วยวิธีที่เหมาะสม ซึ่งก็ขึ้นอยู่กับองค์กรของท่านแล้วล่ะว่าต้องการจะนำข้อมูลเหล่านี้มาใช้ให้เกิดประโยชน์ทางธุรกิจหรือจะปล่อยให้มันอยู่อย่างไร้ค่าและสิ้นเปลือง Storage ต่อไป