พวกเราทำให้เกิดข้อมูลจำนวนมาก ซึ่งมันมากเกินกว่าที่เราจะจัดการกับมัน
พวกเราทำให้เกิดข้อมูลจำนวนมาก ซึ่งมันมากเกินกว่าที่เราจะจัดการกับมัน
ปัญหาไม่ใช่แค่การจัดเก็บข้อมูลเท่านั้น - แต่มันคือวิธีการจัดระเบียบและจัดการกับไฟล์สะสมที่เพิ่มมากขึ้นอยู่ตลอดเวลา
บรรดาเพื่อนๆ ได้แนะนำซีรีส์ที่นำเสนอทางทีวี เรื่อง Silicon Valley ให้ฉันมาเป็นเวลานานแล้ว - และสุดท้ายแล้ว ในเดือนนี้เองที่ฉันได้ตัดสินใจที่จะดูมันเสียที ต้องบอกก่อนว่าฉันรู้สึกสนุกกับมันเป็นอย่างมาก, ในขณะที่มันเป็นเรื่องราวอันน่าขบขัน เป็นที่รู้จักกันดี ซึ่งว่าด้วยเรื่องไร้สาระและความฟุ้งเฟ้อของอุตสาหกรรมเทคโนโลยี
นอกจากนี้ก็ทบทวนความทรงจำด้วยการดูรายการ Mainstream TV ด้วยเหตุผลเพียงแค่การหมกมุ่น เพื่อที่จะหาคำตอบให้กับสมมุติฐานที่เกี่ยวเนื่องกับเรื่องของคอมพิวเตอร์ หลังจากที่คุณได้ชมซีรีส์ผ่านทางเรื่องราวของหนุ่มสาวนับพันคนที่ได้มาพบเจอกัน นับว่าเป็นซีรีส์ที่สร้างความรู้สึกสนุกสนานและแทรกด้วยมุกฮาให้คุณได้หัวเราะดังๆ มันเริ่มต้นขึ้นด้วยการเข้าสู่เรื่องที่เป็นทางการขึ้นมาตรงที่ว่า แล้วซีรีส์ที่เป็นละครตลกที่เรียกเสียงหัวเราะจะเกี่ยวข้องอย่างไรกับการปฏิวัติการบีบอัดข้อมูล ? ตอนนี้เองที่น่าสนใจ และมันก็ค่อนข้างที่จะเป็นไปได้ เพราะเราทุกคนต่างก็รู้สึกถึงความท้าทายในการจัดการกับปริมาณข้อมูลที่เพิ่มขึ้นเรื่อย ๆ พูดในฐานะคนของคนที่บ้านมี NAS ไดร์ฟ ที่เมื่อเร็วๆนี้ เพิ่งจะได้รับเครื่องหมายที่แสดงให้รู้ว่ามีข้อมูล "90% เต็ม" ซึ่งเชื่อแน่ว่ามันจะต้องเป็นปัญหาที่เกี่ยวเนื่องมาจากฉันอย่างแน่นอน
พื้นที่เก็บข้อมูลไม่ใช่ปัญหา
ถ้าพูดอย่างตรงไปตรงมา ฉันประหลาดใจที่วันนี้มันช่างมาถึงในเวลาอันรวดเร็วได้อย่างไร จากเดิมที่ฉันคาดว่า ไดร์ฟขนาด
4 x 2TB จะให้การจัดเก็บข้อมูลเพียงพอโดยกินเวลาที่ยาวนานถึงสิบปีหรือมากกว่านั้น แน่นอนว่าฉันไม่ได้ใช้ปัจจัยอย่างเหมาะสม บนพื้นฐานทางคณิตศาสตร์อันเป็นที่รักของผู้ผลิตฮาร์ดดิสก์, เพราะอะไร ไดร์ฟ 2TB จึงให้พื้นที่ใช้งานเพียง1.8TB เท่านั้น และฉันยังไม่คิดหนักเท่ากับเรื่องที่ฉันควรจะมีส่วนเกี่ยวข้องกับข้อเท็จจริงที่ว่า RAID 5 จะต้องให้ฉันเสียสละความสามารถทั้งหมดของไดร์ฟหนึ่งไดร์ฟ ในฐานะที่ขึ้นชื่อว่าเป็น Fault Tolerance
ถึงแม้ว่าฉันจะคำนึงถึงปัญหาเหล่านั้นอยู่ตลอดเวลาก็ตาม แต่มันก็ถูกกำหนดไว้แล้วว่าสักวันฉันจะต้องเจอกับปัญหาที่ว่านี้ เพราะสิ่งสำคัญที่ฉันไม่ได้เล็งเห็นคุณค่าของมันนั่นก็คือ การใช้พื้นที่ว่างให้หมดไปภายในเวลาอันรวดเร็ว
ในช่วงเวลาห้าปีที่ผ่านมา ฉันได้ทำการเก็บรวบรวมข้อมูลใหม่ๆ ซึ่งก็เกือบเท่าข้อมูลที่ฉันเคยสะสมไว้ในช่วงชีวิตที่ผ่านมาทั้งหมดของฉัน – และฉันก็ได้รู้ว่าประสบการณ์ที่ผ่านมาของฉัน มันไม่ได้ผิดปกติแต่อย่างใด ดังนั้นจึงไม่รู้สึกประหลาดใจเลยว่าทำไมทุกคนใน Silicon Valley จึงต้องการที่จะได้ลงไปสัมผัสกับความอัศจรรย์ของการบีบอัดข้อมูลแบบ Compression Algorithm ของ Richard Hendricks ด้วยตัวของพวกเขา
ถึงแม้จะมีเทคโนโลยีดังกล่าวอยู่แล้วก็ตาม แต่ก็ยังไม่สามารถแก้ปัญหาที่แท้จริงได้ โดยนิสัยส่วนตัวแล้ว ฉันมักจะกระโจนเข้าหาโอกาส ที่จะทำทุกวิถีทางเพื่อให้ได้เพิ่มความจุเป็น 12TB ลงบน NAS ของฉันแบบที่ไม่ต้องเสียค่าใช้จ่าย แต่ถ้าความต้องการในการจัดเก็บข้อมูลของฉันยังคงขยายออกไปเรื่อยๆ อย่างไม่มีที่สิ้นสุด – และฉันก็ได้เห็นแล้วว่าไม่มีเหตุผลที่คนอื่นๆ จะไม่ต้องการเช่นเดียวกันกับฉัน – ซึ่งนั่นก็หมายความว่ามันจะเป็นการเพิ่มความจุเพียงครั้งเดียวเท่านั้น ในไม่กี่ปีต่อมา ไดร์ฟก็จะเต็มอีกครั้งและฉันก็จะต้องกลับไปที่จุดที่ฉันเริ่มต้นอีกครั้ง
ความจริงแล้วนั่นก็ไม่ใช่ความหายนะจริงๆซะทีเดียว ใช่ มันเป็นเรื่องของความน่ารำคาญและต้องสิ้นเปลืองเป็นอย่างมากที่จะต้องลงทุนเพื่อซื้อดิสก์ใหม่ แต่ในเมื่อมันเป็นการจัดเก็บข้อมูลในแบบที่มีราคาถูกและหนาแน่นกว่า มันจึงเป็นเรื่องยากที่จะปล่อยให้เรื่องนี้มันผ่านไปโดยไม่ทำอะไร เมื่อการอัพเกรดแต่ละครั้งนั้นให้ผลที่ดูเหมือนว่าจะคุ้มค่ากว่าครั้งหลังสุดที่ทำมา และโดยเฉพาะอย่างยิ่งผู้นำด้านความเจริญก้าวหน้าทางด้านเทคโนโลยี ยังแสดงให้เห็นว่าไม่มีสัญญาณของการชะลอตัวแม้แต่น้อย
ส่วนที่ยากก็คือเรื่องของการจัดการ
ปัญหามันไม่ได้อยู่ตรงที่การเก็บรักษาข้อมูลทั้งหมดของฉัน แต่กลับเป็นการจัดการกับข้อมูลทั้งหมด ซึ่งในช่วงไม่กี่ปีที่ผ่านมา ปกติแล้วฉันมักจะใช้เวลาเพื่อที่จะนั่งลง และเรียงลำดับไฟล์ทั้งหมดที่กระจัดกระจายในฮาร์ดดิสก์ต่างๆ ของฉันเป็นประจำ ทั้งนี้ก็เพื่อทำการจัดหมวดหมู่และจัดระเบียบข้อมูลสำคัญๆ เหล่านั้น ขณะเดียวกันก็ยังทำการลบข้อมูลที่ไม่ต้องการใช้ออกไป ในปัจจุบันภาระดังกล่าวนั้น ดูเหมือนว่ามันจะหลุดลอยออกไปไกลเกินกว่าความเป็นไปได้ที่ฉันจะทำมันได้อีก เมื่อฉันพยายามที่จะจัดการกับมันเพื่อเก็บให้เป็นเอกสารสำคัญ ฉันไม่ได้เพียงแค่จะต้องจัดการกับไฟล์จำนวนนับสิบหรือหลายร้อยไฟล์เท่านั้น แต่มันคือไฟล์ที่มีจำนวนนับหมื่นไฟล์ และดูเหมือนว่ามันจะเป็นงานที่ใหญ่เกินไปที่จะทำได้ด้วยมือ
สิ่งที่ถือว่าเป็นความผิดพลาดที่เลวร้ายที่สุดในเรื่องนี้ นั่นก็คือคลังเก็บรูปภาพของฉัน ทุกครั้งที่ฉันกดชัตเตอร์ลงบนกล้อง Sony RX100 เล็กๆ ของฉัน นั่นคือข้อมูลขนาด 20MB ที่ถูกนำเข้ามาสู่โลกของฉัน – มันมากพอที่จะบรรจุลงในฮาร์ดดิสก์ทั้งหมดสำหรับพีซีเครื่องแรกของฉัน และหลังจากนั้นฉันก็ต้องกดชัตเตอร์อีกสักสองสามครั้งในกรณีที่มีคนกระพริบตาหรือฉันบังเอิญทำกล้องส่ายไปมา ด้วยสาเหตุพวกนี้ฉันจึงต้องค่อยๆ เพิ่มเทราไบต์เพื่อรูปภาพเหล่านั้น ซึ่งก็เป็นเพียงเศษเสี้ยวเล็กๆ ที่อาจจะคุ้มค่าแก่การรักษา แต่การสืบค้นผ่านคอลเลกชั่นทั้งหมด รวมถึงการจัดอันดับแต่ละภาพเป็นงานที่น่าเบื่อ ซึ่งฉันก็ไม่ต้องการให้สิ่งนี้กลายเป็นศัตรูที่เลวร้ายที่สุดของฉัน
สิ่งที่ฉันต้องการ มันไม่ใช่วิธีที่จะยัดเยียดภาพที่ไม่มีความแตกต่างกันพวกนี้ลงบน Spindles ของฉัน แต่เป็นวิธีที่ทำให้สัมผัสได้ถึงสิ่งที่ฉันมีอยู่ – ตัวอย่างเช่น การใช้ AI-driven approach ที่สามารถหาภาพที่ควรค่าแก่การรักษา และภาพใดที่ฉันจะต้องกำจัดมันออกไป
AI สามารถทำงานได้ดี
นั่นอาจจะฟังดูเหมือนว่ามันเป็นเรื่องที่หนักใจพอสมควร ที่คุณยังลังเลที่จะมอบความไว้วางใจให้กับเครื่องมือใดๆโดยเฉพาะอย่างยิ่งเมื่อมันจะต้องเกิดขึ้นกับสิ่งที่ไม่อาจถูกแทนที่ได้ อย่างเช่นรูปถ่าย แต่ฉันก็ได้เรียนรู้ที่จะไม่ประมาท ด้วยการพยายามเรียนรู้เกี่ยวกับเครื่องมือเหล่านั้น ในความเป็นจริงแล้ว ขณะที่ค้นคว้าข้อมูลในคอลัมน์นี้ ฉันได้ดำเนินการสำรวจเว็บเชิงการตรวจสอบอย่างรวดเร็ว เพื่อดูว่าการใช้ AI มีประสิทธิภาพอย่างไรในการให้คะแนนภาพ – และก็มีใครบางคนที่เคยทำวิธีนี้แล้ว ซึ่งคุณเองก็สามารถทดลองใช้แอปพลิเคชั่นนี้ ได้ที่ everypixel.com/aesthetics: เพียงแค่อัพโหลดภาพของคุณเอง แล้วแอพพลิเคชั่นก็จะทำการตัดสินรูปที่คุณโพสต์เข้าไปนั้น ว่ามันสมบูรณ์แค่ไหน ซึ่งจะเป็นการตัดสินเฉพาะภาพแต่ละภาพ โดยแอปพลิเคชั่นจะเก็บข้อมูลที่ใช้ตัดสินว่ารูปไหนดีไม่ดี จาก designer, editor, และ ช่างภาพ stock photo ที่มีประสบการณ์ ซึ่งเป็นทั้งข้อมูลในด้านบวกและด้านลบ
มันอาจจะดูคล้ายกับอะไรซักอย่างที่เป็นเพียงสิ่งที่ช่วยสร้างความบันเทิงเท่านั้น ซึ่งฉันก็ได้ลองใช้แอปพลิเคชั่นนี้กับรูปถ่ายของตัวเองจำนวนหลายรูป และมันก็ไม่สามารถช่วยตัดสินใจได้ ดังนั้น สิ่งที่ฉันกำลังรออยู่ตอนนี้ คือชีวิตจริงของ Richard Hendricks ที่มาพร้อมกับการกล่าวถึงแนวทางในการแยกประเภท เพื่อใช้เทคนิคในแบบเดียวกันกับเอกสารเก่าทั้งหมด, ภาพหน้าจอ, ไฟล์ PDF และโปรแกรมที่ถูกติดตั้งและกระจัดกระจายอยู่ใน NAS ของฉัน เพื่อช่วยในการคัดแยกข้อมูลที่มีค่าออกจากไฟล์ที่ไม่ได้ใช้ประโยชน์เหล่านั้น ซึ่งก็ดูเหมือนว่ามันจะมีปริมาณที่มากกว่าเสมอ
เป็นที่น่าจับตามอง แม้ว่าแผนการดังกล่าวอาจจะเรียกร้องให้มีการใช้ พลังประมวลผล (Computing Power) มหาศาล ซึ่งเป็นคลังข้อมูลขนาดใหญ่ของ Training Data, และทรัพยากรที่จะต้องซื้อในคลังสมองตามความจำเป็น ไม่แปลกใจเลยว่าการเรียนรู้ด้วย Machine Learning นั้นไม่ได้เป็นการก้าวล้ำมาตั้งแต่แรก; แต่บริษัทขนาดใหญ่อย่างเช่น Google กลับเป็นผู้ที่นำมันเข้ามาในชีวิตของเรา ในรูปแบบต่างๆ เช่นตัวกรองอีเมล์อัตโนมัติของ Gmail รวมทั้งฟีเจอร์การจดจำภาพของ Google Photos ฉันแน่ใจว่า ก่อนหน้านี้นานมาแล้ว Google Docs จะให้คำแนะนำแก่ฉัน ว่าเอกสารใดที่มีความสำคัญ และเอกสารใดที่เห็นควรที่จะลงไปอยู่ในถังขยะ
และทั้งหมดนี้เองที่ทำให้ฉันสงสัยว่า เนื้อหาที่ฉันได้รับมันมีความหมายที่ผิดเพี้ยนไปจาก Silicon Valley หรือไม่ ตั้งแต่ต้นจนจบซีรี่ส์แน่นอนว่าเราต่างก็ให้กำลังใจริชาร์ดและทีมของเขา ขณะที่พวกเขาต้องรับมือกับบริษัทยักษ์ใหญ่ด้านเทคโนโลยี แต่นั่นเป็นเพียงเรื่องที่เกิดขึ้นในซีรี่ส์ ซึ่งในความเป็นจริงนั้น บริษัทยักษ์ใหญ่เหล่านี้เองที่จะช่วยเปลี่ยนโลกในที่สุด - หรือช่วยให้ดีกว่าเดิมแม้ว่าจะเป็นการช่วยในบางกรณีก็ตาม
ที่มา: http://www.itpro.co.uk/