Microsoft Fabric คืออะไร
Microsoft Fabric เป็นระบบโซลูชันที่ให้บริการวิเคราะห์ข้อมูลแบบครบวงจรสำหรับองค์กร ซึ่งครอบคลุมทุกด้านตั้งแต่การจัดการข้อมูล การวิเคราะห์ข้อมูลแบบเรียลไทม์ ไปจนถึงการวิเคราะห์ข้อมูลเชิงธุรกิจ โดยมีการรวมเอาบริการต่าง ๆ เช่น แหล่งข้อมูล (data lake), วิศวกรรมข้อมูล (data engineering) และการรวมข้อมูล (data integration) เข้าด้วยกันในพื้นที่เดียว
SaaS foundation
Microsoft Fabric นำเอาส่วนประกอบทั้งใหม่และเดิมจาก Power BI, Azure Synapse และ Azure Data Factory มารวมกันในสภาพแวดล้อมเดียวกัน โดยทำงานร่วมกันได้อย่างลงตัว ส่วนประกอบเหล่านี้จะถูกแสดงในรูปแบบที่หลากหลายและสามารถปรับเปลี่ยนได้ตามความต้องการ
Fabric นำเสนอข้อมูลแบบต่าง ๆ เช่น วิศวกรรมข้อมูล, โรงงานข้อมูล, วิทยาศาสตร์ข้อมูล, คลังข้อมูล, การวิเคราะห์ข้อมูลแบบเรียลไทม์ และ Power BI ที่ล้วนอยู่บนฐานของ SaaS โดยมีข้อดีดังต่อไปนี้ เช่น:
- ระบบวิเคราะห์ข้อมูลที่ครอบคลุมและผสานเข้ากับอุตสาหกรรมได้อย่างไร้รอยต่อ
- ประสบการณ์การใช้งานที่ใช้งานง่ายและคงมีความคุ้นเคย
- นักพัฒนาสามารถเข้าถึงและใช้ทรัพยากรได้อย่างง่ายดาย
- data lake แบบรวมศูนย์ ที่ช่วยให้สามารถเก็บข้อมูลไว้ที่ตำแหน่งเดิม ในขณะที่ยังคงใช้เครื่องมือวิเคราะห์ข้อมูล
องค์ประกอบของ Microsoft Fabric
Microsoft Fabric คือชุดเครื่องมือการวิเคราะห์ข้อมูลที่ครบครัน โดยออกแบบให้การทำงานร่วมกันได้อย่างไร้รอยต่อ โดยแต่ละเครื่องมือถูกสร้างมาเพื่อตอบสนองความต้องการของแต่ละบทบาทและงานที่แตกต่างกัน ใน Fabric มีเครื่องมือหลายหมวดหมู่เพื่อรองรับการวิเคราะห์ข้อมูลตั้งแต่ต้นจนจบ
Data Engineering
การใช้งาน Spark ซึ่งเป็นแพลตฟอร์มชั้นนำสำหรับการแปลงข้อมูลขนาดใหญ่ และช่วยให้ข้อมูลสามารถเข้าถึงได้ง่ายผ่าน lakehouse นอกจากนี้การทำงานร่วมกันของ Microsoft Fabric Spark กับ Data Factory ทำให้สามารถจัดตารางเวลาและจัดการ notebooks และงาน Spark ได้อย่างมีระเบียบ
Data Factory
Azure Data Factory ผสมผสานความง่ายของ Power Query กับความแข็งแกร่งและประสิทธิภาพของ Azure Data Factory โดยสามารถใช้ตัวเชื่อมต่อกว่า 200 แบบเพื่อเชื่อมต่อกับแหล่งข้อมูลทั้งในสถานที่ (on-premises) และบนคลาวด์
Data Science
ประสบการณ์ใน Data Science ช่วยให้สามารถสร้าง, ปรับใช้ และทำให้โมเดลการเรียนรู้ของเครื่อง (machine learning models) สามารถใช้งานได้จริงอย่างไร้รอยต่อภายในประสบการณ์การใช้งาน Fabric โดยรวมเข้ากับ Azure Machine Learning เพื่อให้มีการติดตามการทดลองและการจดทะเบียนโมเดลอย่างมีระบบ นักวิทยาศาสตร์ด้านข้อมูลสามารถเพิ่มคุณค่าให้กับข้อมูลขององค์กรด้วยการทำนาย(AI) และช่วยให้นักวิเคราะห์ทางธุรกิจสามารถนำเอาการทำนายเหล่านั้นไปใช้ในรายงาน BI วิธีนี้ช่วยเปลี่ยนจากข้อมูลที่เป็นลักษณะบรรยายมาเป็นข้อมูลที่ให้ข้อมูลเชิงทำนายได้
Data Warehouse
ประสบการณ์การใช้งาน Data Warehouse มอบความสามารถในการขยายขนาดของ SQL โดยมีการแยกส่วนการคำนวณออกจากการจัดเก็บข้อมูลอย่างสมบูรณ์ ช่วยให้สามารถขยายขนาดทั้งสองส่วนนี้ได้อย่างอิสระ นอกจากนี้ยังมีการจัดเก็บข้อมูลโดยธรรมชาติในรูปแบบของ Delta Lake ที่เป็นแบบเปิด
Real-Time Analytics
ข้อมูลจากการสังเกตการณ์ซึ่งเก็บรวบรวมมาจากแหล่งที่มาต่าง ๆ เช่น แอปพลิเคชัน, อุปกรณ์ IoT, การโต้ตอบของมนุษย์ และอื่น ๆ อีกมากมาย ปัจจุบันเป็นหมวดหมู่ข้อมูลที่เติบโตเร็วที่สุด ข้อมูลนี้มักจะเป็นแบบกึ่งโครงสร้างในรูปแบบเช่น JSON หรือ Text โดยมีปริมาณมาก และมีโครงสร้างที่เปลี่ยนแปลงไป ลักษณะเหล่านี้ทำให้แพลตฟอร์มการจัดเก็บข้อมูลแบบดั้งเดิมเกิดความยากลำบากในการทำงานร่วมกัน การวิเคราะห์ข้อมูลแบบเรียลไทม์ถือเป็นเครื่องมือที่ดีที่สุดในหมวดหมู่นี้สำหรับการวิเคราะห์ข้อมูลจากการสังเกตการณ์
Power BI
Power BI เป็นแพลตฟอร์ม Business Intelligence ชั้นนำของโลก ซึ่งรับประกันได้ว่าเจ้าของธุรกิจสามารถเข้าถึงข้อมูลทั้งหมดใน Fabric ได้อย่างรวดเร็วและใช้งานได้อย่างสัญชาตญาณ เพื่อให้การตัดสินใจด้วยข้อมูลทำได้ดีขึ้น
Fabric รวมประสบการณ์ทั้งหมดเหล่านี้เข้าไว้ในแพลตฟอร์มเดียวเพื่อนำเสนอแพลตฟอร์มวิเคราะห์ข้อมูลขนาดใหญ่ที่ครบถ้วนที่สุดในอุตสาหกรรม
Microsoft Fabric ช่วยให้องค์กรและบุคคลสามารถเปลี่ยนคลังข้อมูลขนาดใหญ่และซับซ้อนให้กลายเป็นงานที่สามารถดำเนินการและวิเคราะห์ได้จริง
OneLake และ lakehouse
แพลตฟอร์ม Microsoft Fabric ทำให้โครงสร้างของ OneLake และ lakehouse รวมเข้าด้วยกันทั่วทั้งองค์กร
OneLake คืออะไร
Data lake เป็นรากฐานที่สร้างบริการ Fabric ทั้งหมดซึ่งเรียกอีกชื่อว่า OneLake
OneLake สร้างขึ้นบนระบบ Azure Data Lake Storage รุ่นที่ 2 ให้ประสบการณ์แบบ SaaS และเป็นที่เก็บข้อมูลขององค์กรที่ใช้ได้กับทั้งนักพัฒนามืออาชีพและนักพัฒนาทั่วไป OneLake ทำให้การใช้งานง่ายขึ้นโดยไม่ต้องเข้าใจแนวคิดทางโครงสร้างพื้นฐาน เช่น กลุ่มทรัพยากร, RBAC (Role-Based Access Control) หรือการจัดการทรัพยากรของ Azure นอกจากนี้ยังไม่จำเป็นต้องใช้บัญชี Azure ด้วยซ้ำ
OneLake ช่วยลดปัญหาการเก็บข้อมูลแยกส่วนที่เกิดขึ้นเมื่อแต่ละนักพัฒนาสร้างและกำหนดค่าบัญชีจัดเก็บข้อมูลของตนเอง OneLake จึงเป็นระบบจัดเก็บข้อมูลเดียวที่เป็นมาตรฐานสำหรับนักพัฒนาทุกคน ทำให้การค้นหาและแบ่งปันข้อมูลง่ายขึ้น และการปฏิบัติตามนโยบายและความปลอดภัยถูกจัดการอย่างมีระเบียบและสม่ำเสมอ
โครงสร้างองค์กรของ OneLake และ lakehouse
OneLake มีลักษณะเป็นแบบชั้นบนล่างเพื่อทำให้การจัดการภายในองค์กรเป็นเรื่องง่าย ถูกสร้างเข้าไปใน Microsoft Fabric และไม่ต้องการการจัดเตรียมล่วงหน้า OneLake มีเพียงหนึ่งต่อผู้เช่า (tenant) และมีหน้าต่างการมองเห็นไฟล์ระบบที่ครอบคลุมผู้ใช้ ภูมิภาค และแม้กระทั่งคลาวด์ต่าง ๆ ข้อมูลใน OneLake ถูกแบ่งออกเป็นคอนเทนเนอร์ที่สามารถจัดการได้ง่าย
ผู้เช่า (tenant) ถูกแมปเข้ากับรากของ OneLake และอยู่ในระดับสูงสุดของลำดับชั้น สามารถสร้างพื้นที่ทำงาน (workspaces) ได้ไม่จำกัดภายในผู้เช่า ซึ่งสามารถเข้าใจได้ว่าเป็นโฟลเดอร์
ภาพต่อไปนี้แสดงรายการต่าง ๆ ของ Fabric ที่ข้อมูลถูกเก็บ นี่คือตัวอย่างของวิธีที่รายการต่าง ๆ ภายใน Fabric จะเก็บข้อมูลใน OneLake ตามที่แสดง สามารถสร้างพื้นที่ทำงานหลายแห่งภายในผู้เช่า และสร้าง lakehouses หลายแห่งในแต่ละพื้นที่ทำงาน Lakehouse เป็นการรวมกลุ่มของไฟล์ โฟลเดอร์ และตารางที่แทนฐานข้อมูลบน data lake
แหล่งที่มา: Microsoft