วันพุธที่ 12 มกราคม พ.ศ. 2554

WLJ#8: Jan.12, 2011 Data Management

Lecture#8
Jan. 12, 2011

Data Management

ระบบ (System)
: กระบวนการดำเนินงานที่เป็นขั้นตอน โดยประกอบจากส่วนย่อยหลายส่วนมาทำงานร่วมกันคือ
§  วัตถุประสงค์ (Objective) เป็นการกำหนดกรอบความต้องการ โดยอาศัยการสร้างภาพจำลองของผลลัพธ์ที่ต้องการไว้ล่วงหน้า
§  ส่วนประกอบ (Element) ที่จำเป็นสำหรับการรวมเพื่อเป็นผลลัพธ์ เสมือนเครื่องปรุง
Ø  สิ่งนำเข้า (Input) ส่วนประกอบย่อยทั้งหมดที่จำเป็น
Ø  กระบวนการ (Process) วิธีการทำงานที่เป็นระบบ ขั้นตอนการทำงานก่อนหลัง
Ø  ผลลัพธ์ (Output) สิ่งที่ต้องการได้ท้ายที่สุดจากกระบวนการทำงาน
นอกจากนี้ ยังประกอบด้วยรายละเอียดที่จำเป็นต่างๆอีกประกอบกัน อาทิ สิ่งแวดล้อม ขอบเขตการกำหนดระบบ การควบคุมและผลตอบรับกลับ เพื่อประเมินว่าผลลัพธ์ที่ได้ตรงตามความต้องการที่ตั้งใจไว้หรือไม่ รวมทั้งอาจมีความจำเป็นที่จะต้องประสานงานกับระบบย่อยต่างๆอีกด้วย

ระบบสารสนเทศ (Information System)
: ระบบกระบวนการรวบรวมข้อมูล เพื่อประมวลผลและวิเคราะห์ตามวัตถุประสงค์เฉพาะด้านที่กำหนดขึ้นตามความต้องการที่แท้จริง เพื่อให้ได้มาซึ่งสารสนเทศ เป็นผลลัพธ์ขั้นสุดท้ายในการสื่อสารกับผู้รับที่มีสิทธิในการเข้าถึง อีกทั้งเก็บบันทึกข้อมูลที่นำมาเข้าสู่ระบบเพื่อการใช้งานต่อไปในอนาคต (สำหรับสร้างสารสนเทศอื่นต่อ)
§  Data ข้อมูลใดๆที่ยังไม่มีความหมายหรือประโยชน์ต่อผู้ใช้
§  Information ข้อมูลที่มีความหมายและประโยชน์ต่อผู้ใช้ มีส่วนช่วยในการตัดสินใจได้ทันที
§  Knowledge องค์ความรู้ เป็นส่วนที่ผู้ใช้ได้รับประโยชน์ในลักษณะของการเพิ่มพูนความรู้จากเดิมที่เคยมีอยู่
ดังนั้น จะเห็นได้ว่าการจำแนกลักษณะของสิ่งข้างต้นนั้น แบ่งตามประโยชน์หรือความหมายที่ผู้ใช้ที่มีส่วนได้ส่วนเสียหรืออีกนัยหนึ่งคือ ผู้ใช้ที่มีสิทธิและอำนาจในการเข้าถึงข้อมูลนั้นๆ ได้รับ ไม่ได้วัดจากกระบวนการในการได้มาซื้อข้อมูลหรือสารสนเทศนั้น ซึ่งจำเป็นต้องให้ความระมัดระวังในกระบวนการประมวลให้มีประสิทธิภาพมากพอและสื่อสารข้อมูลหรือสารสนเทศนั้นกับผู้ใช้ที่ถูกต้องเหมาะสม
                ในการจัดเตรียมข้อมูลสารสนเทศนั้น ผู้จัดเตรียมต้องสามารถคาดคะเนความต้องการของผู้ใช้ได้ในระดับหนึ่ง พร้อมทั้งสามารถสนับสนุนข้อมูลสารสนเทศที่จำเป็นได้ทันต่อเวลาในรูปแบบที่ใช้ได้จริง โดยส่วนมากมักอยู่ในรูปของรายงาน (Report) เพราะมักถือเป็นรูปแบบมาตรฐานและสามารถใช้ได้กว้างขวางภายในองค์กร

Data Management
: เกิดจากความจำเป็นเพราะต้องมีการเตรียมข้อมูลก่อนนำไปใช้ในเครื่องมือการวิเคราะห์ที่มีอยู่ เพื่อเป็นการอำนวยความสะดวกสำหรับกระบวนการแปลงสภาพข้อมูลดิบให้เป็นสารสนเทศสำหรับการตัดสินใจที่มีคุณภาพ ซึ่งสามารถแบ่งออกเป็น 4 ประเภทคือ
1)      Data Profiling การทำความเข้าใจลักษณะข้อมูลและแหล่งเก็บข้อมูลที่มีอยู่
2)      Data Quality Management การสร้างคุณภาพให้กับข้อมูล
3)      Data Integration การลดความซ้ำซ้อนของข้อมูลด้วยการบูรณาการข้อมูลที่จำเป็นเข้าด้วยกัน
4)      Data Augmentation การพัฒนาและสร้างค่าของข้อมูลให้เพิ่มมากยิ่งขึ้น
โดยมีความลำบากอย่างยิ่งในการจัดการจากเหตุผลดังต่อไปนี้
§  ข้อมูลมีจำนวนมากขึ้นเรื่อยๆตามระยะเวลา
§  ข้อมูลอยู่ในลักษณะที่กระจัดกระจายทั้งองค์กร รวมทั้งอาจมีความซ้ำซ้อนและขาดการควบคุมคุณภาพที่จำเป็น
§  ความจำเป็นที่องค์กรต้องจัดหาข้อมูลจากภายนอกมาประกอบการตัดสินใจด้วย
§  ประเด็นสำคัญในลักษณะของข้อมูลเอง อาทิ ความปลอดภัยของข้อมูล คุณภาพ และการบูรณาการของข้อมูล

Data Life Cycle Process
: ต้องทราบว่าจุดเริ่มต้นและจุดจบของข้อมูลอยู่ที่ใด เพื่อสามารถวางแผนในการเก็บรวบรวมข้อมูลจากแหล่งต่างๆได้ถูกต้อง ซึ่งส่วนใหญ่แล้วนั้นมักจะมาจาก Database ซึ่งเป็นข้อมูลที่บันทึกจาก Transactional Processing System ถือเป็นจุดเริ่มต้นของทุกกระบวนการภายในขององค์กรที่จำเป็นต้องมีมาตรฐานการควบคุมให้ถูกต้องเหมาะสม เพราะเป็นเสมือนข้อมูลพื้นฐานที่จำเป็นที่ต้องนำไปใช้งานต่อเสมอ รวมทั้งอาจมาจากแหล่งข้อมูลภายนอกและความพยายามในการนำความรู้หรือข้อมูลของแต่ละบุคคลออกมาให้สามารถสร้างเป็นฐานข้อมูลและทรัพยากรขององค์กรมากที่สุด

Data Processing
แบ่งออกเป็น 2 ประเภทใหญ่คือ
1)      Transactional ซึ่งเป็นข้อมูลจากการดำเนินงานทั้งหมดที่เกิดขึ้นในทุกวันขององค์กร
2)      Analytical กระบวนการวิเคราะห์ข้อมูลในขั้นสูงขึ้นไป

Data Warehouse
: มีขึ้นนำข้อมูลที่ต้องการ (หรือมีความจำเป็นสำหรับการวิเคราะห์) แยกออกมาจาก Database มีความสำคัญอย่างยิ่งกับองค์กรที่มีความรู้จำนวนมาก มีความต้องการข้อมูลที่มีการวิเคราะห์เพื่อตัดสินใจและต้องการข้อมูลจริงสนับสนุน โดยมีลักษณะสำคัญดังต่อไปนี้
§  Organization มีการจัดเรียงในรูปแบบที่เป็นมาตรฐานเดียวกันสำหรับการวิเคราะห์
§  Consistency มีความหมายและรูปแบบที่คงที่สม่ำเสมอ สามารภเข้าใจได้ตรงกันในระดับของ Data Warehouse
§  Time Variant ข้อมูลอยู่ในลักษณะของช่วงเวลา เพื่อประโยชน์ในการพยากรณ์และเปรียบเทียบ
§  Non-volatile เป็นข้อมูลจากอดีต ไม่มีการเปลี่ยนแปลงหรืออัพเดทข้อมูลระหว่างการใช้งาน
§  Relational สามารถนำมาใช้ได้จริงและเกี่ยวข้องกับการวิเคราะห์ที่ใช้อยู่
§  Client/ Server ตรงตามความต้องการของผู้ใช้งานจริง รวมทั้งง่ายต่อการเข้าใจและเข้าถึง

น.ส. พิมพ์ชนก เกตุสุวรรณ์ 5302110076


ไม่มีความคิดเห็น:

แสดงความคิดเห็น