ผลต่างระหว่างรุ่นของ "คลังข้อมูล"

เนื้อหาที่ลบ เนื้อหาที่เพิ่ม
EmausBot (คุย | ส่วนร่วม)
r2.7.2+) (โรบอต เพิ่ม: ro:Depozit de date
Nullzerobot (คุย | ส่วนร่วม)
เก็บกวาด
บรรทัด 5:
 
== ความแตกต่างจากฐานข้อมูล ==
โดยปกติแล้ว ฐานข้อมูลในองค์กรทั่วไปจะมีลักษณะที่ค่อนข้างทันต่อเหตุการณ์ เช่น ฐานข้อมูลพนักงานก็จะเก็บเฉพาะพนักงานในปัจจุบัน จะไม่สนใจข้อมูลพนักงานเก่า ๆ ในอดีต ซึ่งอาจจะมีข้อมูลอะไรบางอย่าง ที่มีประโยชน์สำหรับผู้บริหาร ในการวิเคราะห์ประสิทธิภาพและคุณลักษณะต่าง ๆ ขององค์กร. นอกจากนี้ ฐานข้อมูลแต่ละอันมักถูกออกแบบมาใช้เก็บข้อมูลเฉพาะด้าน จึงมีข้อมูลเฉพาะบางส่วนขององค์กรเท่านั้น ฉะนั้นคลังข้อมูลจึงถูกออกแบบมา เพื่อรวบรวมข้อมูลในทุกส่วนของทั้งบริษัท ทั้งเก่าและใหม่ไว้ด้วยกัน ไม่มีการลบทิ้งข้อมูลเก่า ๆ ที่ไม่จริงในปัจจุบัน
 
โดยสรุปคือ
บรรทัด 11:
* ฐานข้อมูล (Data Base) ใช้เพื่อทำการประมวลผล (เฉพาะข้อมูลปัจจุบัน)
 
ถ้าองค์กรมีคลังข้อมูลหลาย ๆ อันเพื่อใช้ในการวิเคราะห์ต่าง ๆ แตกต่างกันไป เช่น คลังข้อมูลด้านการเงิน และ คลังข้อมูลด้านทรัพยากรมนุษย์ เรามักเรียกคลังข้อมูลเฉพาะด้านเหล่านี้ว่า [[ตลาดข้อมูล]] ([[:en:data marts|data marts]])
 
อนึ่ง กระบวนการในการใช้ข้อมูลในคลังข้อมูลเพื่อการตัดสินใจ และวางแผนในทางธุรกิจ มักถูกเรียกว่า [[การบริหารธุรกิจอย่างชาญฉลาด]] ([[:en:business intelligence|business intelligence]]).
 
== ประเด็นที่ต้องพิจารณา ==
* ในการรวมฐานข้อมูล อาจมีปัญหาว่าฐานข้อมูลแต่ละอัน อาจถูกออกแบบจากผู้ออกแบบหลายๆ คนทำให้มี schema แตกต่างกันไป (schema ในที่นี้หมายถึงการออกแบบ [[:en:REA model|REA model]] ว่าจะมีกี่ตาราง แต่ละตารางเชื่อมกันอย่างไร มีอะไรเป็น [[:en:primary key|primary key]], [[:en:foreign key|foreign key]] เป็นต้น) ปัญหาใหญ่ก็คือจะนำฐานข้อมูลที่มีความแตกต่างกันมารวมกันได้อย่างไร
* เมื่อรวมกันแล้วต้องการให้ schema ของคลังข้อมูลมีลักษณะแบบไหน. การออกแบบคลังข้อมูลโดยทั่วไป มักจะออกแบบตรงข้ามกับฐานข้อมูลอย่างสิ้นเชิง
** การออกแบบฐานข้อมูลเรามักต้องการให้มี schema ที่ปรับปรุงได้ง่ายๆ (เพราะเราต้องประมวลผลบ่อย) คือในแต่ละตารางมี primary key น้อยๆ และมีตารางจำนวนมากเชื่อมต่อกัน นั่นคือใน REA model มักจะมีหลาย ๆ ตาราง
** ในคลังข้อมูลเราต้องการให้เรียกข้อมูลที่ต้องการดู ([[:en:query|query]]) ง่ายๆ และรวดเร็ว นอกจากนั้นเราไม่ค่อยได้แก้ไขปรับปรุงคลังข้อมูล จึงมักออกแบบให้มีตารางน้อยๆ schema ที่นิยมใช้ในคลังข้อมูลคือ [[:en:star schema|star schema]] (ดู Fig. 15-7)
 
== การวิเคราะห์ข้อมูลในคลังข้อมูล ==
มีสองประเภทใหญ่ ๆ คือ
=== Online Analytical Processing ===
Online Analytical Processing ([[:en:OLAP|OLAP]]) คือการใช้คำค้น (query) เพื่อค้นหาข้อมูลในคลังข้อมูลเหมือนในฐานข้อมูล เหตุผลที่เราไม่ค้นในฐานข้อมูล แต่มาทำในคลังข้อมูลแทนมีสองสาเหตุคือ
* ความเร็ว
* ความครอบคลุมของข้อมูลทั้งบริษัทที่มีอยู่ในคลังข้อมูล