DuckDB
DuckDB คือเครื่องมือวิเคราะห์ข้อมูลสมัยใหม่ที่มีใจความสำคัญ 3 อย่างคือ "รวดเร็ว ฝังตัวได้ และทำงานแบบคอลัมน์" ⚡ คุณสมบัติเด่น (Features): ทำงานแบบฝังตัว (In-Process): รันอยู่ข้างในแอปพลิเคชันของคุณได้เลย ไม่ต้องมีเซิร์ฟเวอร์แยก ทำให้ไม่มีความหน่วงจากเครือข่าย ประมวลผลเร็วปรี๊ด: ทำงานแบบคอลัมน์และประมวลผลข้อมูลทีละชุดใหญ่ๆ (Vectorized) ทำให้ดึงข้อมูลและคำนวณได้ไวมาก อ่านคลาวด์ได้ตรงๆ (Zero-Copy): คิวรีไฟล์อย่าง .csv, .parquet, .json จากคลาวด์ (S3/GCS) ได้โดยตรงแบบไม่ต้องโหลดข้อมูลเข้าเครื่องก่อน SQL ที่นักพัฒนาเลิฟ: มีฟีเจอร์ SQL ล้ำๆ ที่ช่วยลดการเขียนโค้ดซ้ำซาก และอัปเดตล่าสุดยังรองรับข้อมูลแบบโครงสร้างซ้อนกัน (Variant) และพิกัดพื้นที่ (Geometry) ด้วย ??️ กรณีการใช้งาน (Use Cases): วิเคราะห์ข้อมูลในเครื่อง (EDA): เป็นทางเลือกแทน Pandas เวลาเจอไฟล์ใหญ่ๆ วิเคราะห์ได้ลื่นๆ เครื่องไม่ค้าง สถาปัตยกรรมข้อมูลสมัยใหม่: เป็นเอนจินขนาดเบาที่เอาไว้นั่งคิวรีข้อมูลบน Data Lake ได้เลย (ตอบโจทย์สถาปัตยกรรมแบบ Kappa สุดๆ) Edge Analytics & Telemetry: เล็กจนเอาไปฝังในอุปกรณ์ Edge Device, IoT หรือแม้แต่รันบนเว็บเบราว์เซอร์ผ่าน WebAssembly (Wasm) ก็ยังได้ Serverless & Web Apps: เอามาใช้จัดการคิวรีลำดับชั้นที่ซับซ้อนภายในแอปพลิเคชัน โดยไม่ต้องเสียตังค์หรือเสียเวลาดูแลฐานข้อมูลภายนอกที่หนักอึ้ง