วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

WLJ#9: Jan.19, 2011 Data Management and Business Intelligence

Lecture#9
Jan. 19, 2011

Data Management and Data Intelligence
: Data Management (ต่อ)

Major Benefits of Data Warehouse
1)      สามารรวบรวมข้อมูลได้อย่างรวดเร็ว ทันต่อความต้องการการใช้งาน เนื่องจากอำนวนความสะดวกเรื่องการรวบรวมข้อมูลที่มีความจำเป็นไว้ในที่เดียวแล้ว
2)      ผู้ใช้งานสามารถเข้าถึงข้อมูลได้ง่ายและสามารถเข้าใจ รวมทั้งนำไปใช้ต่อได้ง่ายภายใต้รูปแบบเดียวกันของการนำเสนอข้อมูล อาทิ ผ่านระบบ Single Sign-on เป็นการสร้างระบบการเข้าถึงข้อมูลผ่านรหัสเดียวทั้งองค์กร

Characteristics of Data Warehouse (เน้นเฉพาะหัวข้อที่สำคัญ)
§  Organization เน้นที่การจัดระเบียบหรือจัดหมวดหมู่ข้อมูลใหม่จากการรวมข้อมูลหลายแหล่ง
§  Consistency เนื่องจากมีการรวบรวมข้อมูลจากหลากหลายแห่งที่มีรูปแบบการจัดเรียงหรือการรวบรวมที่แตกต่างกัน จึงทำให้ข้อมูลมีความแตกต่าง ไม่สม่ำเสมอทั้งที่เป็นข้อมูลความจริงเรื่องเดียวกันหรือเกี่ยวข้องกัน ซึ่งเมื่อนำมารวมใน Data Warehouse แล้วจะต้องจัดเรียงในรูปแบบเดียวกันเป็นที่ยอมรับและเข้าใจได้อย่างสม่ำเสมอ รวมทั้งในเรื่องรูปแบบการนำเสนออีกด้วย เช่น การนำเสนอในเชิงบริหาร เช่น Drill Downs ซึ่งคือการนำเสนอข้อมูลในลักษณะภาพรวมก่อนแล้วจึงเลือกพิจารณาในรายละเอียดเฉพาะในจุดที่สนใจ (ตรงข้ามกับ Rollups) เป็นต้น
อย่างไรก็ตาม ระบบสารสนเทศหรือ ระบบการจัดการข้อมูลที่ดี ต้องสามารถคัดกรองและจำกัดการให้ข้อมูลสำหรับผ้าที่มีสิทธิเท่านั้น เพื่อความปลอดภัยในการรักษาข้อมูลที่สำคัญที่อาจเกิดผลกระทบกับองค์กรได้

Data Warehouse Process
                กระบวนการต่างจำเป็นเฉพาะในองค์กรที่ต้องการใช้ข้อมูลในการวิเคราะห์และตัดสินใจสำหรับผู้บริหารและทุกภาคส่วนในองค์กร ดังนี้
1)      Meta Data
คือ ข้อมูลของข้อมูล พิจารณาถึงสิ่งที่ต้องการในการจัดทำ Data Warehouse รวมทั้งบอกแนวทางของข้อมูลหรือแหล่งที่ต้องรวบรวมข้อมูลที่จำเป็น แบ่งเป็น Operational Data (ข้อมูลภายในองค์กรจากระบบ TPS) และ External Data (ข้อมูลภายนอกองค์กร อาทิ ข้อมูลองค์กรคู่แข่ง)
2)      Data Staging E(C)TL แบ่งตามองค์ประกอบคือ
§  Extract การคัดแยกข้อมูลออกมารวบรวมเพื่อปรากฎในที่ใหม่คือ Data Warehouse
§  Clean การปรับข้อมูลในอยู่ในรูปที่ครบถ้วนและมีประโยชน์ในการจัดเก็บ
§  Transform การแปลงสภาพข้อมูลให้อยู่ในรูปแบบที่เป็นมาตรฐานและพร้อมใช้งาน
§  Load การโหลดข้อมูลลง Data Cube โดยแสดงในมุมมองที่หลากหลายและพร้อมใช้งาน
ซึ่งทั้งหมดข้างต้นเป็นการเตรียมพร้อมเพื่อนำข้อมูลไปใช้งาน โดยผ่านกระบวนการ Slice and Dice เพื่อระบุว่าต้องการใช้งานข้อมูลใดบ้าง
3)      Data Warehouse Business Subject เพื่อสร้างแหล่งเก็บข้อมูลที่ตรงกับความต้องการย่อยจริง
4)      Business View พัฒนารูปแบบให้การนำเสนอข้อมูลเหมาะกับผู้ที่ต้องการใช้งานจริง อาทิ ผู้บริหารต้องการข้อมูลแบบ Dashboard เป็นต้น
5)      Information Catalog เพื่อเป็นแบบในการเลือกว่าต้องการข้อมูลแต่ละประเภทต้องหาจากที่ใด

Enterprise Data Warehouse
                เสมือน Data Warehouse ของทั้งองค์กรที่ทุกฝ่ายสามารใช้ข้อมูลร่วมกันได้ มีปัญหาคือ อาจเกิดความล่าช้าในการเลือกและนำเสนอข้อมูลเมื่อมีผู้ใช้งานมากกว่าหนึ่งคนในเวลาเดียวกัน ซึ่งสามารถแก้ปัญหาได้โดยการทำ Data Mart คือการตัดแบ่งข้อมูลตามความต้องการของผู้ใช้งานจริง (จากมุมมองของผู้ใช้งาน) แบ่งออกเป็น
§  Replicated (Dependent) Data Mart พัฒนาจาก Data Warehouse ขององค์กรแล้วจึงแยกข้อมูลเฉพาะของแต่ละแผนก
§  Stand-alone Data Mart (ในทางกลับกัน)

: Business Intelligence (BI)

: เครื่องมือในการสร้างสารสนเทศ วิเคราะห์ข้อมูลสำหรับผู้บริหารรัดับสูงขึ้นไป

BI’s Functions and Features
1)      Reporting and Analysis การออกรายงานและการนำเสนอด้านผู้ใช้งาน เช่น
§  Dashboard การนำเสนอข้อมูลแบบ Process Chart ในระดับปฏิบัติงาน
§  Scorecard สำหรับประเมินผลและติดตามงาน เช่น Balance Scorecard (BSC) สำหรับการประเมินผลการดำเนินงานทั้ง 4 ด้านพร้อมกันคือ การเงิน ความพึงพอใจของลูกค้า ระบบการเรียนรู้และการพัฒนาภายใน และการดำเนินงานภายในองค์กร
2)      Analytic เช่น
§  Online Analytical Processing (OLTP) คือ Software ที่ช่วยผู้บริหารในหารเข้าถึงข้อมูลอย่างรวดเร็วในรูปแบบที่เหมาะสมกับความต้องการจริง ทำให้สามารถนำมาใช้งานและตัดสินใจได้ดียิ่งขึ้น
3)      Data Integration การเคลื่อนย้ายเพื่อนำเสนอข้อมูลให้พร้อมกับการใช้งานจริง

Data Mining
: การค้นหาข้อมูลหรือสิ่งที่ไม่เคยทราบมาก่อน เพื่อให้เกิดความเข้าใจและสามารถนำมาปฏิบัติใช้ได้จริง เสมือนการกรองข้อมูลที่มีอยู่เป็นจำนวนมากให้เหลือเฉพาะข้อมูลที่มีความจำเป็นและเป็นประโยชน์กับการตัดสินใจ แบ่งได้คือ
1.       Clustering การจัดกลุ่มของข้อมูลโดยไม่มีการตั้งสมมติฐานไว้ล่วงหน้า
2.       Classification การจัดกลุ่มของข้อมูลแต่มีการตั้งสมมติฐานไว้ล่วงหน้า
3.       Association การสร้างผลสืบเนื่องของข้อมูลให้มีความเกี่ยวข้องกันมากขึ้น
4.       Sequence Discovery การแสดงผลที่เกิดขึ้นสืบเนื่องตามหลังมา
5.       Prediction การคาดการณ์ไปในอนาคตข้างหน้า

Text Mining 
: เสมือนการทำ Data Mining ในกรณีที่ข้อมูลเป็น Unstructured Data หรือข้อมูลไม่มีโครงสร้างที่ตายตัวหรือรูปแบบที่แน่นแน เช่น จดหมายการ complain ของลูกค้า เป็นต้น โดยระบบจะพยายามค้นหาความสัมพันธ์ของประเด็นต่างๆในข้อมูลที่กระจัดกระจายดังกล่าว เพื่อจับกลุ่มประเด็นของข้อมูลสำหรับการใช้งานต่อไป

น.ส. พิมพ์ชนก เกตุสุวรรณ์ 5302110076

ไม่มีความคิดเห็น:

แสดงความคิดเห็น