วันพุธที่ 12 มกราคม พ.ศ. 2554

week 8

Week8 : Data Management

                การที่จะสร้างระบบขึ้นมาจะต้องเกิดจากการมีวัตถุประสงค์ว่าต้องการอะไร หรือนั่นก็คือต้องทราบถึงผลลัพธ์ก่อนว่าในที่สุดแล้วเราต้องการอะไร จากนั้นผลลัพธ์จะเป็นตัวที่จะบอกว่า เราจะต้องมีอะไรในการเริ่มต้น(Input) และจะต้องมีกระบวนการประมวลผลหรือขึ้นตอนต่างๆ (process) ซึ่งเป็นองค์ประกอบหลักของการสร้างระบบ

                ระบบสารสนเทศเป็นระบบที่ให้ผลลัพธ์สุดท้าย (Output) คือ สารสนเทศ โดยมีข้อมูลต่างๆเป็นจุดเริ่มต้นของกระบวนการประมวลผลข้อมูล ให้เป็นรายงานที่สามารถนำไปใช้ประโยชน์ภายในองค์กร โดยสามารถที่จะแสดงรายงานออกมาให้เหมาะสมกับแผนกต่างๆในองค์กรได้ ซึ่งรายงานต่างๆนั้นเป็นข้อมูลที่ผ่านกระบวนการต่างๆมามากหากจะนำไปใช้ต่ออาจมีข้อมูลบางตัวหายไป หรือไม่สามารถจะตรวจสอบได้ ดังนั้นการจัดเก็บข้อมูลดิบก่อนการผ่านกระบวนการจึงมีความจำเป็นกับองค์กรในปัจจุบันเป็นอย่างมาก แต่ข้อมูลเหล่านั้นก็มีปริมาณที่มาก หากจะเก็บทั้งหมดก็อาจจะเป็นการเปลืองทรัพยากร จึงจำเป็นจะต้องมีการบริหารข้อมูลขึ้น
                การบริหารข้อมูลนั้นมีความยากเนื่องจากข้อมูลนั้นมีปริมาณมากขึ้นอย่างมาก นอกจากนี้ยังต้องคำนึงถึงความปลอดภัยของข้อมูล คุณภาพและแนวทางของข้อมูลด้วย

Data management       มีเป้าหมายอยู่ 4 อย่างคือ

-Data profiling คือการนำข้อมูลเข้าสู่ระบบ
-Data quality management คือต้องตรวจสอบคุณภาพของข้อมูล
-Data integration คือการจับกลุ่มของข้อมูลที่มีความคล้ายคลึงกันจากหลายๆแหล่งข้อมูล
-Data augmentation ตรวจสอบความถูกต้องของข้อมูล

Data life cycle process
1.เก็บรวบรวมข้อมูลใหม่
2.นำข้อมูลเข้าสู่ ฐานข้อมูล ปรับรูปแบบเพื่อจัดเก็บใน data warehouse
3.ผู้ใช้สามารถนำข้อมูลจาก data warehouse ไปใช้ในการวิเคราะห์ได้

Data Processing
·         Transactional: เป็น ระบบปฏิบัติการที่ใช้ในการบันทึกข้อมูลในงานทั่วไป งานประจำวันโดยจะจัดเก็บข้อมูลใน ฐานข้อมูล
·         Analytical: ข้อมูลส่วนใหญ่จะมีไว้เพื่อนำมาวิเคราะห์ต่อไป โดยจะ extract ข้อมูลมาจากฐานข้อมูล เฉพาะส่วนที่ต้องการใช้ โดยจะจัดเก็บข้อมูลใน data warehouse เพื่อไม่ให้การดำเนินงานปกติที่ใช้ข้อมูลจากฐานข้อมูลมูลหยุดชะงัก

Data Warehouse
องค์กรที่ตัดสินใจโดยอาศัยพื้นฐานในการวิเคราะห์ข้อมูลมักจะจำเป็นต้องมี Data warehouse โดย Data warehouse มีคุณสมบัติดังนี้
Organizational: นำเอาข้อมูลที่ต้องการมาจัดรูปแบบใหม่ ตามวัตถุประสงค์
Consistency: แก้ไขข้อมูลให้อยู่ในรูปแบบเดียวกันเช่น การบันทึกชื่อของลูกค้าเดียวกันใช้ชื่อแตกต่างกันตามแผนก
Time variant: ตัดสินใจว่าข้อมูลจะเก็บไว้นานเท่าไร
Non-volatile: ข้อมูลจะไม่มีการเปลี่ยนแปลงหรือ update อีกแล้ว มีแต่การ refreshข้อมูลให้ใหม่ขึ้น(ข้อมูลถูกเพิ่มส่วนใหม่                 เข้าไปแต่ไม่ได้แก้ไขที่มีอยู่เดิม แตกต่างจากการ update ที่ทำให้ข้อมูลที่มีอยู่เดิมเปลี่ยนแปลงไป)
Relational: มีโครงสร้างที่สัมพันธ์กัน
Client/server: ใช้ client/server เพื่อให้ผู้ใช้งานสุดท้ายสามารถเข้าถึงข้อมูลได้ง่าย

ไม่มีความคิดเห็น:

แสดงความคิดเห็น