ผู้ใช้:Busarin/กระบะทราย

นี่คือหน้าทดลองเขียนของ Busarin หน้าทดลองเขียนเป็นหน้าย่อยของหน้าผู้ใช้ ซึ่งผู้ใช้มีไว้ทดลองเขียนหรือไว้พัฒนาหน้าต่าง ๆ แต่นี่ไม่ใช่หน้าบทความสารานุกรม ทดลองเขียนได้ที่นี่

หน้าทดลองเขียนอื่น ๆ: หน้าทดลองเขียนหลัก

Big Data:3V

หลายๆคนยังเข้าใจว่า Big Data คือการที่มีข้อมูลดิจิตอลขนาดมหาศาล แต่จริงๆแล้วเรามักจะนิยามความหมายของ Big Data ด้วยคำย่อว่า 3V
โดยประกอบไปด้วย

1.Volume คือมืจำนวนข้อมูลมากเกินกว่าระบบฐานข้อมูลแบบเดิมๆจะสามารถที่จะจัดการได้

2.Velocity คือข้อมูลจะมีการเปลี่ยนแปลงอย่างรวดเร็ว เช่นข้อมูลจาก Social Media ข้อมูลการซื้อขาย ข้อมูล Transaction การเงินหรือการใช้โทรศัพท์ หรือข้อมูลจาก Senso

3.Variety คือข้อมูลจะมีหลากหลายรูปแบบทั้ง Structure และ Unstructure ซึ่งอาจจะอยู่ในรูปทั้ง RDBMS, text, XML, JSON หรือ Image

ทำไมต้องมาสนใจ Big Data

จะเห็นได้ว่าในยุคปัจจุบัน มีการใช้อุปกรณ์ประเภทสมาร์ทโฟนและแท็บเลทกันอย่างแพร่หลาย มี Application ที่ถูกพัฒนามาเพื่อสนับสนุน Platform ดังกล่าวมากมาย รวมถึงความนิยมในการใช้ Social Network และการทำธุรกิจหรือธุรกรรมออนไลน์ต่างๆ ทำให้มีข้อมูลเกิดขึ้นในระบบออนไลน์เหล่านี้เป็นจำนวนมาก และอยู่ในรูปแบบ Unstructured การจัดการกับข้อมูลจำนวนมากและเกิดขึ้นตลอดเวลาประเภทนี้ ไม่สามารถทำได้ด้วยวิธีการจัดเก็บไว้ใน Database รูปแบบเดิมๆ ได้ดี หรือถ้าทำได้ก็ไม่สะดวกสบายนัก และการจะนำมาใช้ให้เกิดประโยชน์ก็ยาก ดังนั้นองค์กรต่างๆ ส่วนมากจึงมักจะมีแต่การจัดเก็บสะสมไปเรื่อยๆแต่ไม่ได้มีการนำมาใช้งานใดๆ สุดท้ายก็เป็นเหมือนขยะกองโตขององค์กร ที่สิ้นเปลืองทรัพยากรในการเก็บรักษาหรือไม่ก็ถูกปล่อยให้สูญหายไปอย่างไร้ค่า ทั้งที่จริงแล้ว ถ้ามีการจัดเก็บและนำมาวิเคราะห์ให้ดี จะพบว่าข้อมูลเหล่านี้เปรียบเสมือนขุมทรัพย์ที่จะทำให้ธุรกิจเติบโตได้อย่างมาก เพราะอุดมไปด้วยข้อมูลที่หลากหลาย สามารถนำมาสร้างมูลค่าเพิ่มให้กับองค์กรได้ในหลายๆ มุมมอง รวมถึงสามารถนำข้อมูลที่ได้มาใช้เพื่อการป้องกันหรือปิดช่องโหว่ที่มีอยู่ในทั้งระบบออนไลน์และระบบภายในขององค์กรได้ และหากมีเครื่องมือที่เหมาะสมก็ยิ่งจะช่วยให้การนำข้อมูลออนไลน์มาใช้ในการดำเนินธุรกิจนั้นเกิดประสิทธิภาพในการวิเคราะห์ข้อมูลจนสามารถนำมาใช้ประโยชน์ได้ดียิ่งขึ้น ทำให้เกิดมุมมองใหม่ๆ สามารถมองเห็นในสิ่งที่คู่แข่งยังมองไม่เห็นหรือไม่ได้ใส่ใจที่จะนำมาใช้ ทำให้องค์กรของเราได้เปรียบหรือมีความเหนือชั้นกว่าในการดำเนินธุรกิจ และมีโอกาสประสบความสำเร็จมากกว่า ยกตัวอย่างบริษัทที่นำ Big Data เข้ามาใช้งานและสร้างความเติบโตให้องค์กรจนประสบความสำเร็จจนสามารถอยู่ในกลุ่มผู้นำของธุรกิจ อาทิเช่น Google , Facebook ,Twitter ,Yahoo เป็นต้น

ตอนนี้ถ้าองค์กรมีความสนใจที่จะนำ Big Data เข้ามาใช้ อาจจะกำลังสงสัยว่าจะจัดการกับข้อมูลประเภทนี้ได้อย่างไร ดังที่ได้เกริ่นไว้แล้วแต่แรกว่าไม่สามารถจัดการ Big Data ได้ด้วยระบบ Database แบบเดิมๆ เนื่องด้วยข้อมูลมีปริมาณมากเกินที่จะรับได้ และรูปแบบก็มีความหลากหลายเกินไป ดังนั้น จึงจำเป็นต้องใช้ระบบการเก็บข้อมูลหรือการประมวลผลในรูปแบบอื่นๆ เข้ามาช่วยจัดการแทนระบบแบบเดิมๆ ซึ่งการจัดการกับ Big Data นั้น ณ ปัจจุบันมีเครื่องมือที่ได้รับความนิยมอย่างแพร่หลายและมีชื่อเสียงตัวหนึ่งเข้ามาช่วยจัดการ นั่นคือ Hadoop ที่พัฒนามาจาก Open Source Technology ให้ทำหน้าที่เป็น Distributed Storage ที่สามารถเก็บข้อมูลขนาดใหญ่ที่เป็น Unstructured และนำมาประมวลผลได้ ซึ่งองค์ประกอบหลักๆ ของ Hadoop ประกอบด้วย

Hadoop Distributed File System (HDFS) ที่ทำหน้าที่เป็น Storage จัดเก็บข้อมูลให้อยู่ในรูปแบบที่เหมาะสมพร้อมใช้งาน
Map Reduce ใช้ในการพัฒนาโปรแกรมเพื่อประมวลผลให้ได้ผลลัพธ์ตามต้องการ ด้วยการเข้าถึงข้อมูลอย่างรวดเร็ว

นอกจาก Hadoop แล้วยังมี Software อื่นๆ ที่มาช่วยเสริมการทำงานของ Hadoop ให้มีประสิทธิภาพมากยิ่งขึ้นในการทำงานร่วมกับฐานข้อมูลเดิมขององค์กร เช่น Sqoop หรือ Hive เป็นต้น รวมถึง Splunk ซึ่งสามารถนำมา Integrate ร่วมกับ Hadoop เพื่อให้สามารถทำงานทำได้สะดวก มี Dashboard ที่สามารถทำการค้นหาข้อมูลเชิงลึกได้แบบ Real-Time แล้วนำมาผลที่ได้มาแสดงให้อยู่ในรูปแบบของกราฟฟิคที่สวยงามดูง่าย สำหรับเรื่องราวของ Hadoop และ Splunk นั้นทางบิ๊กฟิชฯ จะขอนำไปกล่าวถึงไว้ในบทความฉบับหน้า ซึ่งท่านผู้อ่านสามารถติดตามได้จากเว็ปไซต์ของบริษัทฯ สุดท้ายนี้ถ้าจะให้กล่าวโดยสรุปสำหรับเทคโนโลยี Big Data ก็คือ การนำข้อมูลที่มีปริมาณมากๆ มาผ่านการประมวลผล การวิเคราะห์ และแสดงผลด้วยวิธีที่เหมาะสม ซึ่งก็ขึ้นอยู่กับองค์กรของท่านแล้วล่ะว่าต้องการจะนำข้อมูลเหล่านี้มาใช้ให้เกิดประโยชน์ทางธุรกิจหรือจะปล่อยให้มันอยู่อย่างไร้ค่าและสิ้นเปลือง Storage ต่อไป

^[1] ^[2]

[1] ttp://thanachart.org/2013/10/05/big-data-%E0%B9%81%E0%B8%A5%E0%B8%B0%E0%B9%80%E0%B8%97%E0%B8%84%E0%B9%82%E0%B8%99%E0%B9%82%E0%B8%A5%E0%B8%A2%E0%B8%B5-hadoop-%E0%B8%81%E0%B8%B1%E0%B8%9A%E0%B8%81%E0%B8%B2%E0%B8%A3%E0%B8%9E%E0%B8%B1/

[2] ttp://www.bigfish.co.th/archives/428

[1]

[2]