ผลต่างระหว่างรุ่นของ "คลังข้อมูล"

เนื้อหาที่ลบ เนื้อหาที่เพิ่ม
SieBot (คุย | ส่วนร่วม)
โรบอต แก้ไข: ru:Хранилище данных
Manop (คุย | ส่วนร่วม)
บรรทัด 1:
{{รอการตรวจสอบ}}
{{ลิงก์ไปภาษาอื่น}}
{{ต้องการอ้างอิง}}
 
'''คลังข้อมูล''' ([[:en:data warehouse|data warehouse]]) คือ [[ฐานข้อมูล]]ขนาดยักษ์ ที่รวบรวมฐานข้อมูลจากหลายแหล่งหลายช่วงเวลา ซึ่งอาจมี [[:en:schema|schema]] แตกต่างกัน มาไว้รวม ณ ที่เดียวกัน (และใช้ schema เดียวกัน)
 
== คลังข้อมูลแตกต่างจากฐานข้อมูลอย่างไร? ==
 
โดยปกติแล้ว ฐานข้อมูลในองค์กรทั่วไปจะมีลักษณะที่ค่อนข้างทันต่อเหตุการณ์ เช่น ฐานข้อมูลพนักงานก็จะเก็บเฉพาะพนักงานในปัจจุบัน จะไม่สนใจข้อมูลพนักงานเก่า ๆ ในอดีต ซึ่งอาจจะมีข้อมูลอะไรบางอย่าง ที่มีประโยชน์สำหรับผู้บริหาร ในการวิเคราะห์ประสิทธิภาพและคุณลักษณะต่าง ๆ ขององค์กร. นอกจากนี้ ฐานข้อมูลแต่ละอันมักถูกออกแบบมาใช้เก็บข้อมูลเฉพาะด้าน จึงมีข้อมูลเฉพาะบางส่วนขององค์กรเท่านั้น ฉะนั้นคลังข้อมูลจึงถูกออกแบบมา เพื่อรวบรวมข้อมูลในทุกส่วนของทั้งบริษัท ทั้งเก่าและใหม่ไว้ด้วยกัน ไม่มีการลบทิ้งข้อมูลเก่า ๆ ที่ไม่จริงในปัจจุบัน
บรรทัด 24:
== การวิเคราะห์ข้อมูลในคลังข้อมูล ==
มีสองประเภทใหญ่ ๆ คือ
=== Online Analytical Processing ===
Online Analytical Processing ([[:en:OLAP|OLAP]]) คือการใช้คำค้น (query) เพื่อค้นหาข้อมูลในคลังข้อมูลเหมือนในฐานข้อมูล เหตุผลที่เราไม่ค้นในฐานข้อมูล แต่มาทำในคลังข้อมูลแทนมีสองสาเหตุคือ
* ความเร็ว
บรรทัด 36:
1. ฐานข้อมูลเชิงสัมพันธ์ (Relational DataBase) โดยทั่วไปแล้วระบบงานประจำมีการจัดเก็บข้อมูลแบบ [[RDBMS]] และ [[data warehouse]] ก็มีการจัดเก็บข้อมูลแบบ [[RDBMS]] ซึ่งอาจจะมีโครงสร้างข้อมูล แบบ [[star schema]] และอาจจะเป็นได้ทั้ง [[normalized & denormalized]]
 
2. ฐานข้อมูลหลายมิติ ( multidimentional database) ข้อมูลที่จัดเก็บในฐานข้อมูลหลายมิติอาจมาจากฐานข้อมูลเชิงสัมพันธ์ หรือระบบงานปัจจุบันโดยจะแปลง
การจัดเก็บข้อมูลเสียใหม่ โดยมีโครงสร้างการจัดเก็บแบบ array โดยทั่วไปแล้วฐานข้อมูลหลายมิติจะยอมให้สิทธิการเขียนข้อมูลลงในฐานข้อมูล ในช่วงเวลาหนึ่งเพียงคนเดียว แต่อนุญาตให้หลาย ๆ คน เข้าค้นหาข้อมูลในเวลาเดียวกัน หรือมิฉะนั้นก็อนุญาตให้ค้นหาข้อมูลเพียงอย่างเดียว
 
บรรทัด 50:
[[การทำเหมืองข้อมูล]] (Data Mining) คือ การหารูปแบบ (pattern) อะไรบางอย่างที่ซ่อนอยู่ในข้อมูล ที่มองผิวเผินแล้วไม่อาจสังเกตเห็นได้ เนื่องจากข้อมูลมีปริมาณมาก เช่น การค้นหา[[กฎความสัมพันธ์]] ([[:en:association rules|association rules]]) ของสินค้าใน[[ห้างสรรพสินค้า]] เราอาจพบว่าลูกค้าร้อยละ 90 ที่ซื้อเบียร์ จะซื้อผ้าอ้อมเด็กด้วย, ซึ่งเป็นข้อมูลให้ทางห้างคิด[[รายการส่งเสริมการขาย]]ใหม่ๆ ได้; หรือ ธนาคารอาจพบว่า คนทั่วไปที่มีอายุ 20-29 ปี และมีรายได้ในช่วง 20,000-30,000 บาท มักซื้อเครื่องเล่น[[เอ็มพีสาม]], ธนาคารอาจเสนอให้คนกลุ่มนี้ทำ[[บัตรเครดิต]] โดยแถมเครื่องเล่นดังกล่าว เป็นต้น
 
== ดูเพิ่ม ==
* [[ฐานข้อมูล]]
* [[การทำเหมืองข้อมูล]]