กูเกิลประกาศปรับวิธีการคิดราคา BigQuery บริการเก็บและวิเคราะห์ข้อมูลขนาดใหญ่ จากเดิมที่คิดราคาแบบ flat rate ที่ 5 ดอลลาร์ต่อปริมาณการคิวรี 1TB เปลี่ยนมาเป็นการแบ่งระดับ 3 tier เริ่มต้นที่ 0.04 ดอลลาร์ต่อสล็อต
ราคาใหม่ของ BigQuery แบ่งเป็น Standard, Enterprise, Enterprise Plus ที่จับตลาดแตกต่างกัน แพ็กเกจแบบ Standard สำหรับคนที่ใช้เป็นครั้งคราว (ad hoc) ไม่ต้องการฟีเจอร์ระดับองค์กร ราคาลดลงมาเหลือ 0.04 ดอลลาร์ต่อสล็อตต่อชั่วโมง (หนึ่งชั่วโมงรันได้สูงสุด 16 สล็อต) ส่วนแพ็กเกจ Enterprise/Enterprise Plus มีฟีเจอร์ระดับสูงเพิ่มขึ้น และสามารถซื้อแบบการันตีทั้งปี โดยมีราคาถูกลงได้
เมื่อปีที่แล้ว กูเกิลมีโครงการชื่อ Open Source Insights สแกนซอร์สโค้ดในโครงการโอเพนซอร์สยอดนิยมจำนวนมาก (เช่น npm, PyPI, Go, Maven, Cargo) เพื่อมาวิเคราะห์หาความเชื่อมโยงในแง่มุมต่างๆ
ประเด็นหนึ่งที่ถูกจับตามองอย่างมากในโลกโอเพนซอร์สคือ supply chain security ช่องโหว่ความปลอดภัยในแพ็กเกจยอดนิยม ที่อาจส่งผลสะเทือนต่อซอฟต์แวร์จำนวนมาก (เช่น กรณีของ log4j ) การสแกนซอร์สโค้ดย่อมเป็นวิธีการหนึ่งที่ช่วยให้โอกาสค้นพบช่องโหว่มากขึ้น
Google Cloud เปิดตัวบริการฐานข้อมูลแบบใหม่ BigLakes มันคือการขยายร่าง Google BigQuery ให้มาใช้กับข้อมูลประเภท object storage ได้ด้วย เท่ากับว่าใช้คำสั่งและอินเทอร์เฟซแบบ BigQuery ได้กับทั้งข้อมูลแบบดั้งเดิม (database/data warehouse) และข้อมูลแบบวัตถุ (data lake)
Gerrit Kazmaier ผู้บริหารฝ่ายฐานข้อมูลของ Google Cloud บอกว่าในโลกฐานข้อมูล มีเส้นแบ่งระหว่าง data base กับ data lake มายาวนาน เหตุผลคือข้อมูลประเภทใหม่ๆ มีจำนวนเพิ่มขึ้นเร็วมาก จนไม่สามารถจัดการด้วยวิธีแบบดั้งเดิม (database) ไหว จึงต้องมีการจัดการแบบ data warehouse (structured) และ data lake (unstructured) ขึ้นมารับมือ
กูเกิลอัพเพิ่มฟีเจอร์บริการ BigQuery บน Google Cloud ให้รองรับฟิลด์แบบ JSON ทำให้ผู้ใช้สามารถใส่ข้อมูลกลุ่มที่ไม่มี schema ชัดเจนเข้ามา
ก่อนหน้านี้ BigQuery รองรับข้อมูลประเภท STRUCT ที่เป็นออปเจกต์ซับซ้อนภายในได้อยู่แล้ แต่ก็ต้องประกาศโครงสร้างข้อมูลไว้ล่วงหน้า หากคิวรีโดยอ้างฟิลด์ที่ไม่มีข้อมูลก็จะ error ไปเลย แต่สำหรับ JSON การคิวรีจะใช้ syntax แบบเดียวกันกับ STRUCT แต่หากอ้างถึงฟิลด์ที่ไม่มีข้อมูลก็จะได้ค่า NULL
Google Sheets ประกาศเพิ่มฟีเจอร์ใหม่ที่น่าสนใจหลายอย่าง อย่างแรกคือ Sheets Smart Fillเป็นระบบ autocomplete ที่ช่วยอ่านใจเราว่าอยากเติมข้อมูลใดลงในชีท โดยเลียนแบบแพทเทิร์นการทำงานของเรา
ตัวอย่างที่กูเกิลนำมาโชว์คือมีคอลัมน์ที่ประกอบด้วยชื่อ+นามสกุล และคอลัมน์ที่กรอกคำว่า "Hi+ชื่อ" ซึ่ง Google Sheets จะเข้าใจว่าเราพยายามทำอะไร และกรอก "Hi+ชื่อ" ให้ครบทุกแถวโดยไม่ต้องใส่สูตรใดๆ (ดูภาพประกอบ)
Google Cloud Platform นำชุดข้อมูลที่เกี่ยวข้องกับ COVID-19 มาเปิดให้ผู้สนใจสามารถวิเคราะห์กันบน Google BigQuery ได้สะดวกและไม่คิดเงิน
ชุดข้อมูลนี้เป็นข้อมูลสาธารณะอยู่แล้ว เช่น ข้อมูลจาก World Bank, OpenStreetMap, Johns Hopkins Center for Systems Science and Engineering (JHU CSSE)
ข้อมูลนี้สามารถใช้งานได้ฟรีไปจนถึงวันที่ 15 กันยายน ส่วนบริการ BigQuery ก็มีเวอร์ชันฟรีให้ลองใช้งาน หากใช้ข้อมูลไม่เกิน 10GB
กูเกิลบอกว่าอยากให้นักวิจัย นักวิเคราะห์ข้อมูลทั่วโลก เข้ามาช่วยกันนำข้อมูลนี้ไปใช้งาน การเปิดให้ใช้ฟรียิ่งจะช่วยให้คนเข้ามามีส่วนร่วมมากขึ้น
ประเด็นหนึ่งที่บริการคลาวด์ถูกโจมตีมาตลอดคือเรื่อง vendor lock-in หรือการถูกบังคับโดยอ้อมให้ต้องอยู่กับผู้ให้บริการคลาวด์เจ้านั้นตลอดไป เพราะการย้ายออกมีต้นทุนแฝงสูงมาก โดยเฉพาะบริการเฉพาะทางของผู้ให้บริการแต่ละราย (เช่น AI หรือ data) ที่ไม่ใช่บริการสามัญ (เช่น compute หรือ storage)
กรณีศึกษาล่าสุดมาจาก Discord แอพแชทยอดนิยมของวงการเกมเมอร์ ที่ระบุว่าย้ายระบบคลังข้อมูล (data warehouse) จากเดิมที่ใช้ Amazon Redshift มาเป็นบริการเทียบเคียงกันคือ BigQuery ของกูเกิล
หมายเหตุ: บทความนี้มาจากบล็อกของกูเกิล (เขียนโดยทีมงาน Discord ในฐานะลูกค้า GCP) ย่อมเชียร์บริการฝั่งกูเกิล แต่นำมาให้อ่านเพื่อเป็นกรณีศึกษาเรื่องการย้ายคลาวด์ข้ามค่าย
Google Cloud ประกาศเปิดตัวฟีเจอร์ BigQuery sandbox ระบบสำหรับทดสอบ BigQuery โดยไม่มีค่าใช้จ่าย และไม่ต้องใส่บัตรเครดิตด้วย เพื่อให้ผู้ใช้เรียนรู้ BigQuery ได้ง่ายขึ้นโดยไม่มีข้อจำกัดเรื่องค่าใช้จ่ายเข้ามา
แม้จะเปิดให้ใช้งานฟรี แต่ BigQuery sandbox ก็มีฟีเจอร์ทั่วไปเหมือนผู้ใช้จ่ายเงิน ไม่ว่าจะเป็นพลังในการประมวลผล, รันคำสั่ง query ด้วยภาษา SQL บน dataset ทั้งขนาดใหญ่และเล็ก, มี Data Studio ระบบ visualization ข้อมูลให้ใช้งาน และรองรับความสามารถใหม่ ๆ อย่างเช่น Machine Learning หรือ Geospatial Information Systems ด้วย
Google ประกาศเพิ่มฟีเจอร์ใหม่ให้ BigQuery ระบบ data warehouse บน Google Cloud Platform โดยมีฟีเจอร์ใหม่ที่สำคัญคือ รองรับข้อมูลสารสนเทศเชิงพื้นที่ (geospatial), โมเดลและฟังก์ชันใหม่บน BigQuery ML, การตั้งกำหนดเวลาการ query และอื่น ๆ
ฟีเจอร์แรกคือ BigQuery GIS เป็นการรองรับข้อมูลอิงตามลักษณะพื้นที่ (geospatial) โดยผู้ใช้สามารถวิเคราะห์ big data โดยใช้คำสั่ง SQL ปกติ โดยตัว BigQuery จะใช้ไลบรารีการคำนวณแบบเดียวกับที่ใช้ใน Earth Engine, Google Maps และ Google Earth จึงเหมาะกับการใช้งานกับข้อมูลปริมาณมาก
ตอนนี้ BigQuery GIS เปิดให้ใช้งานในแบบเบต้าแล้ว อ่านรายละเอียดเพิ่มเติมได้ที่ BigQuery GIS Documentation
Google BigQuery เป็นบริการ data warehouse ที่กำลังมาแรงอย่างมากในสายงาน analytics, big data และ machine learning ด้วยเหตุผลว่าเราสามารถวิเคราะห์ข้อมูลขนาดใหญ่ด้วยภาษา SQL ที่คุ้นเคย โดยไม่จำเป็นต้องบริหารฐานข้อมูลเอง และจ่ายเงินเท่าที่ใช้งาน
ปกติแล้ว ผู้ใช้ต้องเป็นคนอัพโหลดข้อมูลขึ้น BigQuery เอง (หรือดึงมาจากบริการอื่นๆ ของกูเกิล เช่น Google Analytics หรือ Google Ads) แต่กูเกิลก็เตรียมฐานข้อมูลสาธารณะ (public dataset) ไว้ให้อีกจำนวนหนึ่ง เช่น สำมะโนประชากรของสหรัฐ สถิติจากธนาคารโลก หรือข้อมูลจาก GitHub
Google ประกาศเพิ่มฟีเจอร์ใหม่ BigQuery ML โดยเป็นการนำฟีเจอร์ machine learning ใส่เข้าไปใน BigQuery ระบบฐานข้อมูลขนาดใหญ่ของ Google Cloud Platform และตอนนี้เริ่มเปิดให้ทดลองใช้งานแบบเบต้าแล้ว
การใส่ machine learning จะช่วยอำนวยความสะดวกให้ผู้ใช้งาน BigQuery สามารถสร้างโมเดล regression ทั้งแบบ linear และ logistic ได้จากในตัวฐานข้อมูลโดยตรง ไม่ต้องย้ายข้อมูลไปมา รวมถึงใช้โมเดลเพื่อทำนายได้เพียงแค่เขียน SQL เพิ่มอีกเล็กน้อยเท่านั้น
กูเกิลประกาศเพิ่มความสามารถให้ บริการฐานข้อมูลขนาดใหญ่ BigQuery หลายอย่างดังนี้
BigQuery เป็นบริการฐานข้อมูลขนาดใหญ่ของกูเกิล มันใช้หลักการ big data ที่สร้างตารางข้อมูลที่ไม่ซับซ้อนแต่มีขนาดใหญ่มากๆ (ระดับ 1 พันล้านแถว) ซึ่งต่างไปจากแนวทางของ relational database มาก
BigQuery คือการออกแบบคำสั่งคล้ายๆ SQL (แต่ฟีเจอร์ไม่ครบเท่า SQL) เพื่อให้ค้นหรือวิเคราะห์ข้อมูลในตารางได้ง่ายๆ และกูเกิลทำหน้าเว็บให้เราป้อนคำสั่ง BigQuery แล้วรับข้อมูลกลับได้จากหน้าเว็บเลย (อัพโหลด/ดาวน์โหลดข้อมูลผ่าน CSV )
- Read more about กูเกิลเปิดบริการ BigQuery สำหรับคนทั่วไปแล้ว
- Log in or register to post comments