KNIME บริษัทซอฟต์แวร์ด้าน Data Science และ AI แบบโอเพนซอร์ส ประกาศรับเงินเพิ่มทุน 30 ล้านดอลลาร์ จากผู้ลงทุนเดิมคือกองทุน Invus ซึ่งลงทุนแล้วรวม 50 ล้านดอลลาร์
เงินลงทุนรอบใหม่นี้ KNIME บอกว่าจะนำมาใช้ขยายทีมงาน จากปัจจุบันมีพนักงาน 250 คนทั่วโลก ดูแลลูกค้าองค์กรที่จ่ายเงินใช้งานเกือบ 400 แห่ง มีรายได้ปีที่ผ่านมา 30 ล้านยูโร
KNIME เป็นซอฟต์แวร์ด้านวิทยาศาสตร์ข้อมูลแบบ low-code มีผู้ใช้งานเกือบ 5 แสนคน โมเดลรายได้คือการขายซอฟต์แวร์ให้ลูกค้าองค์กรที่มีการสนับสนุน และใช้งานฟีเจอร์ต่าง ๆ ได้เต็มประสิทธิภาพ
Posit บริษัทผู้พัฒนา RStudio ซอฟต์แวร์ IDE สำหรับภาษา R ที่นิยมกันในวงการ ล่าสุดออกซอฟต์แวร์ IDE ตัวใหม่ที่พัฒนาจาก Visual Studio Code ชื่อว่า Positron
Positron นิยามตัวเองว่าเป็น IDE สำหรับวงการ data science รองรับการเขียนโปรแกรมหลายภาษา ออกแบบมาสำหรับกลุ่มผู้ใช้ VS Code หรือ Jupyterlab ที่ทำงาน data science ด้วยภาษา Python หรือ R แต่ยังไม่พอใจกับคุณสมบัติของซอฟต์แวร์ที่ใช้อยู่ อยากได้ฟีเจอร์ระดับสูงหรือความสามารถในการปรับแต่งที่มากขึ้น
กูเกิลออกตัวเชื่อมต่อข้อมูลระหว่าง Looker แพลตฟอร์มวิเคราะห์ข้อมูลในเครือ Google Cloud กับ Power BI ของไมโครซอฟท์ ช่วยให้ดึงข้อมูลจาก Looker ไปแสดง visualization บน Power BI ได้ด้วย
ตัว Looker เองนั้นมีหน้าที่นำข้อมูลจากแหล่ง (data source) มาวิเคราะห์ก่อนชั้นแรก เรียกว่าเป็น semantic layer ก่อนนำไปจัดแสดงเป็น visualization อีกที ซึ่งรองรับหลายช่องทาง ได้แก่ Looker Studio ของตัวเอง, Google Sheets ผ่าน Connected Sheets และ Power BI ซึ่งถือเป็นช่องทางที่สาม การเชื่อมต่อนี้ย่อมทำให้นักวิเคราะห์ข้อมูลที่คุ้นกับ Power BI Desktop ทำงานสะดวกขึ้น
- Read more about Google Looker ออกตัวเชื่อมข้อมูลไปแสดงผลใน Power BI
- 1 comment
- Log in or register to post comments
ศูนย์วิจัยแห่งชาติ Argonne National Laboratory (ANL) ประกาศเตรียมพัฒนาปัญญาสร้างดิษฐ์สร้างคอนเทนต์ (generative AI) ด้านวิทยาศาสตร์โดยเฉพาะ ที่มีขนาดใหญ่มากถึง 1 ล้านล้านพารามิเตอร์
ปัญญาประดิษฐ์ใหม่นี้จะฝึกด้วยข้อมูลทางวิทยาศาสตร์ทั้งหมด โดยมีข้อมูลหลายรูปแบบ ทั้งข้อความ, โค้ด, รายงานวิทยาศาสตร์ รวมถึงข้อมูลการทดลองด้านชีววิทยา, เคมี, วัสดุสาสตร์, ฟิสิกส์, การแพทย์, และข้อมูลอื่นๆ ผลที่ได้น่าจะช่วยในการออกแบบโมเลกุล สามารถแนะนำการทดลองใหม่ๆ ตั้งแต่การทดลองทางชีววิทยา, เคมี, ไปจนถึงการออกแบบยา
Pandas ไลบรารีสำหรับการประมวลข้อมูลตารางยอดนิยมในภาษา Python ออกเวอร์ชั่น 2.0 แม้ว่าการทำงานโดยทั่วไปจะเหมือนเดิมแทบทุกประการ แต่ก็มีความเปลี่ยนแปลงเล็กๆ น้อยๆ ที่ทำให้โค้ดเดิมอาจจะทำงานกับเวอร์ชั่นใหม่ไม่ได้
ในแง่การใช้งาน ส่วนสำคัญคือระบบแพ็กเกจที่มีการจัดชุดไลบรารีที่เกี่ยวข้องมาให้เป็นชุดๆ เช่น pandas[performance]
จะติดตั้งไลบรารีเพิ่มเติมเกี่ยวกับการเร่งความเร็ว หรือ pandas[excel]
ก็จะติดตั้งไลบรารีที่เกี่ยวกับการอ่านเขียนไฟล์ Excel มาให้ สำหรับด้านประสิทธิภาพ ระบบ copy-on-write จะ copy จริงต่อเมื่อมีการแก้ไขค่าเท่านั้น หากยังไม่ได้แก้ไขก็จะเป็น view อ้างอิงไปที่ข้อมูลเดิม
- Read more about Pandas ไลบรารีประมวลข้อมูลออกเวอร์ชั่น 2.0
- Log in or register to post comments
JupyterLab ออก JupyterLab App แอปเดสก์ทอปที่รวมเอาทั้งเบราว์เซอร์และระบบหลังบ้านไว้ในตัว ทำให้นักพัฒนาเริ่มพัฒนาโน้ตบุ๊กได้ง่ายขึ้นอีกขั้น
ที่จริงแล้วโครงการนี้พัฒนามาหลายปีตั้งแต่ปี 2017 แต่ก็ไม่มี release ใหม่ๆ และไม่มีการพัฒนาเพิ่มเติมมานาน จนกระทั่งปีนี้ Mehmet Bektas จาก Splunk เข้ามาช่วยพัฒนาจนออกเป็นเวอร์ชั่นล่าสุด
JupyterLab App มาพร้อมกับไลบรารีสำคัญอย่าง numpy, scipy, pandas, ipywidgets, และ matplotlib ในตัว และหลังจากออกเวอร์ชั่นล่าสุดชุมชนก็กลับมาคึกคักอีกครั้ง
ที่มา - Jupyter Blog
บริษัท JetBrains สร้างชื่อมาจาก IntelliJ ซอฟต์แวร์ IDE สำหรับภาษา Java แต่ภายหลังก็ใช้วิธี วางตัว IntelliJ Platform เป็นแพลตฟอร์มกลาง สำหรับพัฒนา IDE เฉพาะทาง ต่อยอดเป็น IDE ตัวอื่นๆ ของตัวเองอีกที เช่น PyCharm (Python), PhpStorm (PHP), GoLand (Go), RubyMine (Ruby)
ล่าสุด JetBrains เปิดตัว IDE ใหม่ (อีกแล้ว) ชื่อ DataSpellสำหรับงานสาย data science โดยเฉพาะ ลักษณะเดียวกับ RStudio ของสายภาษา R แต่ในระยะแรกเน้นที่ภาษา Python เป็นหลัก
Pandas ไลบรารีวิเคราะห์ข้อมูลภาษาไพธอนยอดนิยม เตรียมออกรุ่น 1.0.0 โดยตอนนี้เวอร์ชั่น 1.0.0rc0 ก็เปิดให้ดาวน์โหลดแล้ว
ความเปลี่ยนแปลงสำคัญของเวอร์ชั่น 1.0 คือทางโครงการจะมีนโยบายรักษาความเข้ากันได้ของ API ตามแนวทาง Semantic Versioning โดยเวอร์ชั่นหลัก (ตัวเลขหน้าสุด) จะไม่มีการถอด API ออก มีแต่การประกาศเตือน deprecation เท่านั้น
นอกจากความเสถียรของ API แล้ว ยังมีการเพิ่มชนิดข้อมูลแบบสตริงเป็นการเฉพาะ, ข้อมูลแบบ boolean ที่รองรับกรณีบางแถวไม่มีข้อมูล, เปลี่ยนเอนจินการรันฟังก์ชั่นเป็น Numba เพื่อเพิ่มประสิทธิภาพ, และการแสดงข้อมูลตารางออกมาเป็น Markdown
คาดว่าเวอร์ชั่น 1.0.0 ตัวจริงจะออกภายในสัปดาห์หน้า
Netflix เปิดตัว Polynote ที่เป็น IDE แบบโน้ตบุ๊กแบบเดียวกับ Jupyter แต่รองรับหลายภาษา (polyglot) ในไฟล์งานเดียวกัน โดยรองรับภาษาหลักคือ Scala พร้อมรองรับ Python และ SQL โดยแต่ละภาษาสามารถอยู่ในโน้ตบุ๊กเดียวกัน แต่ต้องแยกคนละเซลล์เท่านั้น
นอกจากฟีเจอร์การพัฒนาแบบหลายภาษาแล้ว Polynote ยังสนับสนุนการใช้โน้ตบุ๊กแบบเป็นโค้ดโปรแกรม รันจากบนลงล่างจนจบ ทำให้ผลการรันโน้ตบุ๊กแต่ละครั้งคาดเดาได้ (reproducibility) จากระบบติดตามสถานะของตัวแปรต่างๆ ก่อนเข้าไปรันในเซลล์ ทำให้เมื่อลบเซลล์หนึ่งทิ้งไปใน ความเปลี่ยนแปลงที่เกิดจากเซลล์นั้นๆ ก็หายไปด้วย ผลที่ได้จากการรันแต่ละเซลล์เหมือนการรันจากต้นไฟล์ลงมาถึงแต่ละเซลล์ ทำให้โน้ตบุ๊กที่ได้สามารถนำไปรันภายหลังได้
ไมโครซอฟท์อัพเดตส่วนไพธอนสำหรับ Visual Studio Code ทำให้สามารถรัน Jupyter Notebook ได้เต็มรูปแบบ นับเป็นความก้าวหน้าล่าสุดหลังจากไมโครซอฟท์มีแนวทางรองรับ data science บน VS Code ตั้งแต่ปีที่แล้ว
หลังจากนี้ VS Code ที่ติดตั้งส่วนเสริมไพธอนรุ่นล่าสุดจะสามารถสร้าง Jupyter Notebook ได้ในตัว ขณะพัฒนาโค้ดจะมี IntelliSense ช่วยแนะนำโค้ดให้ พร้อมหน้าจอปรับตัวแปร นอกจากนี้เพื่อพัฒนาเสร็จแล้วยังสามารถแปลงเป็นโค้ดไพธอนธรรมดาได้อีกด้วย
การรัน Jupyter Notebook ใน VS Code ตรงๆ จะรัน Jupyter ขึ้นมาบนเครื่องอัตโนมัติ หรือหากต้องการเชื่อมต่อกับเซิร์ฟเวอร์ภายนอกก็คอนฟิกได้
Mozilla เปิดตัวโครงการ Iodide สภาพแวดล้อมสำหรับพัฒนา (IDE) งานประเภท data science คล้ายกับ Jupyter และ R-Studio แต่มีจุดต่างที่ซอฟต์แวร์ทั้งหมดรันอยู่บนเบราว์เซอร์
Iodide ใช้ WebAssembly ดึงเอา Python, Numpy, Pandas, Matplotlib, และแพ็กเกจอื่นๆ มาทำงานในจาวาสคริปต์ ทำให้กระบวนการพัฒนาโดยรวมเหมือนการพัฒนาเว็บ สามารถเขียน Markdown ลงไปใน notebook แล้วปรับแต่งการแสดงผลด้วย CSS การใช้ WebAssembly ทำให้ประสิทธิภาพโดยรวมช้าลงบ้างแต่ก็ยังอยู่ในระดับใช้งานได้
งานวิทยาศาสตร์ข้อมูล (data science) มักนิยมภาษา R หรือไลบรารี Pandas ในไพธอนที่มองข้อมูลเป็น data frame ที่เป็นตาราง ตอนนี้ NVIDIA ก็หันมาจับตลาดนี้ด้วยการเปิดตัว โครงการ RAPIDS ที่เปิดให้นักวิทยาศาสตร์ข้อมูลสามารถใช้ชิปกราฟิกประมวลผลข้อมูลเหล่านี้ได้เร็วขึ้น
ตอนนี้ ใน GitHub และเอกสารการใช้งานมีเฉพาะไลบรารี pygdf ไลบรารีสำหรับโหลดข้อมูลแบบ data frame แต่เมื่อโครงการสมบูรณ์จะมีโครงการ cuML ที่เทียบเท่า scikit-learn และ cuGRAPH สำหรับงานประมวลผลกราฟ และไลบรารีสำหรับแสดงผลข้อมูลประสิทธิภาพสูงเพราะใช้ชิปราฟิกเรนเดอร์
โครงการยังไม่สมบูรณ์นัก แต่หาก NVIDIA บุกตลาดนี้โดยตรงก็นับว่าน่าจับตามอง
ธนาคารกสิกรไทยประกาศจัดตั้ง 2 ฝ่ายงานใหม่เพื่อดูแลการสร้างความสามารถด้าน Data Analytics กำหนดแผนสรรหาและพัฒนาบุคลากรด้าน Data Alchemist หรือ Data Scientist โดยเฉพาะ
สองฝ่ายงานใหม่ประกอบด้วย Enterprise Data Analytics Department (EA) เป็นศูนย์กลางดูแลการสร้างความสามารถในการวิเคราะห์ข้อมูลเชิงลึกของธนาคาร, สรรหาและจัดสรรทรัพยากรเพื่อสนับสนุนการวิเคราะห์ข้อมูล และ Digital Lending Department (DL) รับผิดชอบการวิเคราะห์ข้อมูลเชิงลึกจากหลายฐานข้อมูล เพื่อนำเสนอสินเชื่อได้ตรงกับความต้องการของลูกค้าในราคาที่เหมาะสมกับระดับความสี่ยงของลูกค้าแต่ละราย ดูแลการปล่อยสินเชื่อผ่าน K PLUS
ในการจัดตั้งฝ่ายงานใหม่นี้ทางธนาคารได้เพิ่มตำแหน่งงาน Data Scientist เข้ามาด้วย
ในงาน Blognone Tomorrow นอกจากการบรรยายแล้ว ยังมีส่วนของนิทรรศการ ซึ่งบริษัทหนึ่งที่มาออกบูธด้วยคือ Sertis ผู้ให้บริการด้านการพัฒนาระบบวิทยาศาสตร์ข้อมูล (data science) และการใช้ปัญญาประดิษฐ์ (artificial Intelligence) ในองค์กร
Sertis ก่อตั้งขึ้นในปี 2014 โดยคุณธัชกรณ์ วชิรมน ผู้บริหารที่นำประสบการณ์จากการทำงานด้านให้คำปรึกษาในการบริหารจากต่างประเทศ พบว่าการใช้ข้อมูลเป็นสิ่งสำคัญในการขับเคลื่อนธุรกิจยุคต่อไปจึงกลับมาเปิด Sertis ในประเทศไทย และเริ่มติดต่อ data scientist จากต่างประเทศมาร่วมงานกัน
- Read more about รู้จักกับ Sertis ผู้ให้บริการสำหรับงานจัดการข้อมูลโดยเฉพาะ
- Log in or register to post comments
Data Cafe Thailand เป็นชุมชนของผู้สนใจด้าน Data Science ที่สนับสนุนโดยบริษัท MFEC และคณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย
หลายคนอาจรู้จักโครงการ Data Cafe ที่ เปิดคอร์สฝึกอบรม Data Scientist อาชีพที่ร้อนแรงที่สุดในตอนนี้ ซึ่งได้รับความสนใจอย่างล้นหลาม ( โครงการเพิ่งปิดรับรุ่นที่สองไปเมื่อเร็วๆ นี้ )
ในงาน Blognone Tomorrow ผู้ร่วมก่อตั้งโครงการ Data Cafe ทั้งสองคนคือ ดร.วิโรจน์ จิรพัฒนกุลอดีต Data Scientist ของ Facebook ( บทสัมภาษณ์ ) และ ดร.ธนชาตย์ ฤทธิ์บำรุงผู้เชี่ยวชาญด้าน Data Analytics และอาจารย์พิเศษหลายสถาบัน มาร่วมกันเล่าการประยุกต์ใช้พลังของ "ข้อมูล" เพื่อยกระดับการทำงานขององค์กร โดยเล่าประสบการณ์ของ Data Cafe ในการสร้างและพัฒนาคนในตำแหน่งที่หายากเป็นอย่างยิ่งในตอนนี้
โครงการ Data Cafe Fellowship เพื่อการสร้างบุคคลากรด้าน data science เปิดรับสมัครรุ่นที่สอง หลังจาก จบรุ่นแรกไปเมื่อปลายปีที่แล้ว
โครงการนี้จะเปิดโอกาสให้ผู้สนใจที่ได้รับคัดเลือกสามารถเข้าถึงข้อมูลจริงจากหน่วยงานต่างๆ ที่ร่วมโครงการ เพื่อหาประโยชน์ทางธุรกิจที่เป็นไปได้ ผู้ที่ได้รับเลือกเข้าโครงการจะได้รับอบรมนานสามเดือน ตั้งแต่ 4 สิงหาคม จนถึง 27 ตุลาคม
ปีนี้คุณสมบัติผู้สมัครจำเป็นต้องรู้ SQL เบื้องต้นมาแล้ว, รู้จักเครื่องมือวิเคราาะห์ข้อมูล, และเขียนโปรแกรมเป็นอยู่แล้ว
ส่งใบสมัครได้ทาง Google Form
นักพัฒนาสาย data science คงต้องเจองานที่พัฒนาบน Jupyter Notebook กันอยู่เรื่อยๆ โดยทั่วไปเรามักพัฒนาโครงการเดียวบน notebook เพื่อทดลองพารามิเตอร์ต่างๆ ตอนนี้ทาง Jupyter ก็ประกาศโครงการใหม่ JupyterLab ที่เป็น IDE เต็มรูปแบบสำหรับการพัฒนา ว่าพร้อมใช้งานทั่วไปในระดับเบต้าแล้ว
ตอนนี้ JupyterLab อยู่ที่เวอร์ชั่น 0.31.11 มันสามารถรันคอนโซลแบบ iPython หรือ Jupyter Notebook ได้ในตัว ฟีเจอร์สำคัญคือมีระบบ extension เสริมให้เลือกติดตั้งได้จำนวนมาก เช่น ipywidget สามารถทำตัวรับอินพุตแบบต่างๆ
คาดว่า JupyterLab จะออกรุ่น 1.0 ได้ภายในปีนี้
ที่มา - Jupyter Blog
เมื่อไม่นานมานี้ Anaconda, Inc. ผู้พัฒนาแพลตฟอร์ม data science ชื่อดังได้ประกาศความร่วมมือกับไมโครซอฟท์ เพื่อนำ Anaconda Python ไปใช้งานภายในผลิตภัณฑ์และบริการของไมโครซอฟท์เริ่มต้นจาก Azure Machine Learning, Machine Learning Server, Visual Studio และ SQL Server (อ่านรายละเอียดทั้งหมด ที่นี่ )
ผลจากข้อตกลงดังกล่าวทำให้ทางฝั่ง Anaconda ได้รับสิทธิแจกจ่ายเครื่องมือพัฒนาของไมโครซอฟท์อย่าง Visual Studio Code เช่นกัน โดยตั้งแต่กลางเดือนกุมภาพันธ์ที่ผ่านมาทางบริษัทได้ผนวก VS Code เข้ามาในตัวติดตั้งของ Anaconda distribution เครื่องมือจัดการแพคเกจ Python ซึ่งกำลังเป็นที่นิยมอย่างมาก เพื่อช่วยให้ผู้ใช้ Anaconda ใช้งาน VS Code ได้สะดวกขึ้น
โครงการ Data Cafe Fellowship เพื่อการสร้างบุคคลากรด้าน data science ให้สามารถวิเคราะห์ข้อมูลและสร้างประโยชน์ให้ธุรกิจจากการวิเคราะห์ข้อมูล ตอนนี้โครงการก็จบลงแล้ว และมีการนำเสนอโครงการที่ได้รับคัดเลือกมา 6 โครงการต่อกรรมการ
ข้อมูลเปิดเผยทาง Data Cafe ลง โฆษณาประชาสัมพันธ์โครงการกับ Blognone แต่งานจบโครงการนี้ทาง Blognone ไปร่วมงานในฐานะผู้สังเกตการณ์ตามปกติ
Yelp เว็บรีวิวร้านและอาหารและธุรกิจบริการ ออกรายงานผลการประเมินเศรษฐกิจท้องถิ่นชื่อว่า Yelp Local Economic Outlook โดยนำข้อมูลธุรกิจและรีวิวใน Yelp มาวิเคราะห์ร่วมกับทีมฝ่ายเนื้อหาและนักวิทยาศาสตร์ของบริษัท เพื่อค้นหา 50 เมืองในอเมริกาที่มีโอกาสสูงสำเร็จการทำธุรกิจ ตลอดจน 50 ย่านที่น่าสนใจ และ 10 หมวดธุรกิจที่มีโอกาสเติบโตสูง
Carl Bialik ผู้ดูแลข้อมูลของ Yelp บอกว่าด้วยปัจจัยที่หลากหลายซึ่งส่งผลต่อการทำธุรกิจ พื้นที่จึงเป็นปัจจัยหนึ่งที่สำคัญ และข้อมูลของ Yelp ก็ช่วยแสดงให้เห็นภาพที่ชัดเจนมากขึ้นในหลายมิติ ทั้งยังมีความรวดเร็วกว่าการเก็บข้อมูลของหน่วยงานรัฐ โดยรายงานนี้จะมีการนำเสนอออกมาต่อเนื่องเป็นระยะ และปรับปรุงปัจจัยที่ใช้ในการจัดอันดับด้วย
Stack Overflow เผยสถิติความนิยมของภาษาโปรแกรมมิ่งบนเว็บไซต์ของตัวเอง โดย Python เป็นภาษาที่มีอัตราการเติบโตสูงมากในรอบ 5 ปีที่ผ่านมา โดยจะเฉพาะจากกลุ่มประเทศพัฒนาแล้ว-รายได้สูงที่มีสัดส่วนทราฟฟิก 64% ของเว็บไซต์
สถิติของ Stack Overflow ย้อนกลับไปถึงปี 2011 พบว่าอัตราการเติบโตของ Python เพิ่มสูงมาก และในเดือนมิถุนายน 2017 แท็ก Python กลายเป็นแท็กอันดับหนึ่งของเว็บไซต์ แซงหน้า Java/JavaScript เป็นที่เรียบร้อย
ในช่วงไม่กี่ปีที่ผ่านมาบริษัทต่างๆ พากันหาโอกาสที่จะปรับปรุงการทำงานหรือพัฒนาบริการด้วยการใช้ข้อมูลมาค้นหาแนวทางใหม่ๆ โดยเหล่า Data Scientist ที่มีความสามารถในการสกัดเอาความรู้ออกมาจากข้อมูลจำนวนมากที่มีอยู่ในองค์กรได้ ความสำเร็จในการใช้ข้อมูลเหล่านี้ทำให้งานสาย Data Scientist กลายเป็นงานที่ร้อนแรงที่สุดในปี 2017 จากการจัดอันดับโดย CompTIA และ Glassdoor
เว็บจัดหางานระดับโลกอย่าง Glassdoor ระบุว่างาน Data Scientist เป็นงานที่ดีที่สุดในสหรัฐฯ จากรายได้เฉลี่ยที่สูง, ความต้องการมีจำนวนมากกว่าอันดับสองอย่าง DevOps Engineer เกือบเท่าตัว และผู้ทำงานก็มีความพึงพอใจกับงานที่ทำมากกว่า
Cisco เสริมทัพอีกรอบด้าน analytics solutions ด้วยการเข้าซื้อทีม Advanced Analytics และเทคโนโลยีด้าน Data Science จากบริษัท Saggezza ทั้งนี้ไมได้เปิดเผยมูลค้าของการเข้าซื้อครั้งนี้
บริษัท Saggezza ก่อตั้งเมื่อปี 2006 โดยให้บริการด้าน data analytics, visualization applications และ business process optimization
Cisco มองว่าการทำ End-To-End Analytics Solution จะมีบทบาทสำคัญในวิเคราะห์ข้อมูลในระบบเครือข่าย ปรับแต่งแก้ไขเงื่อนไขที่ซับซ้อน และช่วยให้การทำเครือข่ายอัตโนมัติ (Network Automation) ได้ผลออกมาอย่างมีประสิทธิภาพ ทั้งนี้เพื่อตอบโจทย์ลูกค้าโดยเฉพาะอย่างยิ่งกับลูกค้ากลุ่มคลาวด์
กูเกิลประกาศซื้อ Kaggle ชุมชนคนทำงานด้าน data science ที่ใหญ่ที่สุดในโลก โดยจะนำเข้าไปอยู่ในทีม Google Cloud
Kaggle เป็นเว็บไซต์ที่เปิดในปี 2010 ประกอบด้วยเว็บบอร์ด ประกาศหางาน ชุดข้อมูลที่นำไปใช้ต่อได้ เป็นแหล่งให้นักวิทยาศาสตร์ข้อมูลมาแลกเปลี่ยนโมเดล จัดการแข่งขันด้านวิเคราะห์ข้อมูลและ machine learning ระหว่างกัน ปัจจุบัน Kaggle มีสมาชิกเป็นคนทำงานด้านนี้หลักแสนคน
หลังการขายกิจการให้กูเกิลแล้ว Kaggle จะยังให้บริการตามปกติ ทางบริษัทระบุว่าการผนวกเอาชุมชน data scientist ที่ใหญ่ที่สุด กับบริการคลาวด์ด้าน machine learning รายใหญ่ที่สุด จะส่งผลให้ Kaggle ไปต่ออีกได้ไกล
สาขาวิทยาศาสตร์ข้อมูล (data science) เป็นสาขาที่ได้รับความนิยมสูงในช่วงหลายปีที่ผ่านมา แต่คนภายนอกอาจจะนึกไม่ออกนักว่ามันใช้ทำอะไรได้บ้าง ล่าสุดสิงคโปร์เผยแพร่กระบวนการหาสาเหตุของรถไฟฟ้าขัดข้องที่รบกวนประชาชนสิงคโปร์มาหลายเดือน
รถไฟฟ้าสิงคโปร์สาย Circle Line มีปัญหาขัดข้องอยู่เนืองๆ มาหลายเดือนจากการที่ระบบเบรกฉุกเฉินทำงานโดยหาสาเหตุไม่ได้ จุดเกิดความขัดข้องกระจายไปตามสถานีต่างๆ ขบวนรถที่ได้รับผลกระทบ และกระจายไปตามช่วงเวลา ทำให้ไม่แน่ชัดว่ามีระบบที่ส่วนใดบกพร่องกันแน่