Lecture#9
Jan. 19, 2011
Data Management and Data Intelligence
: Data Management (ต่อ)
Major Benefits of Data Warehouse
1) สามารรวบรวมข้อมูลได้อย่างรวดเร็ว ทันต่อความต้องการการใช้งาน เนื่องจากอำนวนความสะดวกเรื่องการรวบรวมข้อมูลที่มีความจำเป็นไว้ในที่เดียวแล้ว
2) ผู้ใช้งานสามารถเข้าถึงข้อมูลได้ง่ายและสามารถเข้าใจ รวมทั้งนำไปใช้ต่อได้ง่ายภายใต้รูปแบบเดียวกันของการนำเสนอข้อมูล อาทิ ผ่านระบบ Single Sign-on เป็นการสร้างระบบการเข้าถึงข้อมูลผ่านรหัสเดียวทั้งองค์กร
Characteristics of Data Warehouse (เน้นเฉพาะหัวข้อที่สำคัญ)
§ Organization เน้นที่การจัดระเบียบหรือจัดหมวดหมู่ข้อมูลใหม่จากการรวมข้อมูลหลายแหล่ง
§ Consistency เนื่องจากมีการรวบรวมข้อมูลจากหลากหลายแห่งที่มีรูปแบบการจัดเรียงหรือการรวบรวมที่แตกต่างกัน จึงทำให้ข้อมูลมีความแตกต่าง ไม่สม่ำเสมอทั้งที่เป็นข้อมูลความจริงเรื่องเดียวกันหรือเกี่ยวข้องกัน ซึ่งเมื่อนำมารวมใน Data Warehouse แล้วจะต้องจัดเรียงในรูปแบบเดียวกันเป็นที่ยอมรับและเข้าใจได้อย่างสม่ำเสมอ รวมทั้งในเรื่องรูปแบบการนำเสนออีกด้วย เช่น การนำเสนอในเชิงบริหาร เช่น Drill Downs ซึ่งคือการนำเสนอข้อมูลในลักษณะภาพรวมก่อนแล้วจึงเลือกพิจารณาในรายละเอียดเฉพาะในจุดที่สนใจ (ตรงข้ามกับ Rollups) เป็นต้น
อย่างไรก็ตาม ระบบสารสนเทศหรือ ระบบการจัดการข้อมูลที่ดี ต้องสามารถคัดกรองและจำกัดการให้ข้อมูลสำหรับผ้าที่มีสิทธิเท่านั้น เพื่อความปลอดภัยในการรักษาข้อมูลที่สำคัญที่อาจเกิดผลกระทบกับองค์กรได้
Data Warehouse Process
กระบวนการต่างจำเป็นเฉพาะในองค์กรที่ต้องการใช้ข้อมูลในการวิเคราะห์และตัดสินใจสำหรับผู้บริหารและทุกภาคส่วนในองค์กร ดังนี้
1) Meta Data
คือ ข้อมูลของข้อมูล พิจารณาถึงสิ่งที่ต้องการในการจัดทำ Data Warehouse รวมทั้งบอกแนวทางของข้อมูลหรือแหล่งที่ต้องรวบรวมข้อมูลที่จำเป็น แบ่งเป็น Operational Data (ข้อมูลภายในองค์กรจากระบบ TPS) และ External Data (ข้อมูลภายนอกองค์กร อาทิ ข้อมูลองค์กรคู่แข่ง)
2) Data Staging E(C)TL แบ่งตามองค์ประกอบคือ
§ Extract การคัดแยกข้อมูลออกมารวบรวมเพื่อปรากฎในที่ใหม่คือ Data Warehouse
§ Clean การปรับข้อมูลในอยู่ในรูปที่ครบถ้วนและมีประโยชน์ในการจัดเก็บ
§ Transform การแปลงสภาพข้อมูลให้อยู่ในรูปแบบที่เป็นมาตรฐานและพร้อมใช้งาน
§ Load การโหลดข้อมูลลง Data Cube โดยแสดงในมุมมองที่หลากหลายและพร้อมใช้งาน
ซึ่งทั้งหมดข้างต้นเป็นการเตรียมพร้อมเพื่อนำข้อมูลไปใช้งาน โดยผ่านกระบวนการ Slice and Dice เพื่อระบุว่าต้องการใช้งานข้อมูลใดบ้าง
3) Data Warehouse Business Subject เพื่อสร้างแหล่งเก็บข้อมูลที่ตรงกับความต้องการย่อยจริง
4) Business View พัฒนารูปแบบให้การนำเสนอข้อมูลเหมาะกับผู้ที่ต้องการใช้งานจริง อาทิ ผู้บริหารต้องการข้อมูลแบบ Dashboard เป็นต้น
5) Information Catalog เพื่อเป็นแบบในการเลือกว่าต้องการข้อมูลแต่ละประเภทต้องหาจากที่ใด
Enterprise Data Warehouse
เสมือน Data Warehouse ของทั้งองค์กรที่ทุกฝ่ายสามารใช้ข้อมูลร่วมกันได้ มีปัญหาคือ อาจเกิดความล่าช้าในการเลือกและนำเสนอข้อมูลเมื่อมีผู้ใช้งานมากกว่าหนึ่งคนในเวลาเดียวกัน ซึ่งสามารถแก้ปัญหาได้โดยการทำ Data Mart คือการตัดแบ่งข้อมูลตามความต้องการของผู้ใช้งานจริง (จากมุมมองของผู้ใช้งาน) แบ่งออกเป็น
§ Replicated (Dependent) Data Mart พัฒนาจาก Data Warehouse ขององค์กรแล้วจึงแยกข้อมูลเฉพาะของแต่ละแผนก
§ Stand-alone Data Mart (ในทางกลับกัน)
: Business Intelligence (BI)
: เครื่องมือในการสร้างสารสนเทศ วิเคราะห์ข้อมูลสำหรับผู้บริหารรัดับสูงขึ้นไป
BI’s Functions and Features
1) Reporting and Analysis การออกรายงานและการนำเสนอด้านผู้ใช้งาน เช่น
§ Dashboard การนำเสนอข้อมูลแบบ Process Chart ในระดับปฏิบัติงาน
§ Scorecard สำหรับประเมินผลและติดตามงาน เช่น Balance Scorecard (BSC) สำหรับการประเมินผลการดำเนินงานทั้ง 4 ด้านพร้อมกันคือ การเงิน ความพึงพอใจของลูกค้า ระบบการเรียนรู้และการพัฒนาภายใน และการดำเนินงานภายในองค์กร
2) Analytic เช่น
§ Online Analytical Processing (OLTP) คือ Software ที่ช่วยผู้บริหารในหารเข้าถึงข้อมูลอย่างรวดเร็วในรูปแบบที่เหมาะสมกับความต้องการจริง ทำให้สามารถนำมาใช้งานและตัดสินใจได้ดียิ่งขึ้น
3) Data Integration การเคลื่อนย้ายเพื่อนำเสนอข้อมูลให้พร้อมกับการใช้งานจริง
Data Mining
: การค้นหาข้อมูลหรือสิ่งที่ไม่เคยทราบมาก่อน เพื่อให้เกิดความเข้าใจและสามารถนำมาปฏิบัติใช้ได้จริง เสมือนการกรองข้อมูลที่มีอยู่เป็นจำนวนมากให้เหลือเฉพาะข้อมูลที่มีความจำเป็นและเป็นประโยชน์กับการตัดสินใจ แบ่งได้คือ
1. Clustering การจัดกลุ่มของข้อมูลโดยไม่มีการตั้งสมมติฐานไว้ล่วงหน้า
2. Classification การจัดกลุ่มของข้อมูลแต่มีการตั้งสมมติฐานไว้ล่วงหน้า
3. Association การสร้างผลสืบเนื่องของข้อมูลให้มีความเกี่ยวข้องกันมากขึ้น
4. Sequence Discovery การแสดงผลที่เกิดขึ้นสืบเนื่องตามหลังมา
5. Prediction การคาดการณ์ไปในอนาคตข้างหน้า
Text Mining
: เสมือนการทำ Data Mining ในกรณีที่ข้อมูลเป็น Unstructured Data หรือข้อมูลไม่มีโครงสร้างที่ตายตัวหรือรูปแบบที่แน่นแน เช่น จดหมายการ complain ของลูกค้า เป็นต้น โดยระบบจะพยายามค้นหาความสัมพันธ์ของประเด็นต่างๆในข้อมูลที่กระจัดกระจายดังกล่าว เพื่อจับกลุ่มประเด็นของข้อมูลสำหรับการใช้งานต่อไป
น.ส. พิมพ์ชนก เกตุสุวรรณ์ 5302110076
ไม่มีความคิดเห็น:
แสดงความคิดเห็น