ผู้รับเหมาที่พยายามพัฒนาแอปพลิเคชันปัญญาประดิษฐ์สำหรับรัฐบาลต้องเผชิญกับความท้าทาย นั่นคือชุดข้อมูลที่ดีสำหรับการฝึกอบรมอัลกอริทึม ขณะนี้ชุดข้อมูลใหม่ที่มุ่งเน้นของรัฐบาลกลางกำลังมาจากแหล่งที่ไม่น่าเป็นไปได้ Federal Drive กับ Tom Temin ได้รับรายละเอียดจากนักข่าว Bloomberg Government Josh Axelrodบันทึกการสัมภาษณ์: ข้อมูลเชิงลึกโดย DocuSign: แบบสำรวจใหม่ของ Federal News Network แสดงให้เห็นว่าพนักงานฝ่ายทรัพยากรบุคคลของรัฐบาลทราบดีว่าหน่วยงานต่างๆ จะต้องเร่งความเร็วและปรับปรุงกระบวนการสรรหา การจ้างงาน และการรักษาพนักงาน ดาวน์โหลด
รายงานการสำรวจของเราตอนนี้เพื่อเรียนรู้เพิ่มเติม
Tom Temin:อย่างแรกเลย มันมาจากไหน? เริ่มกันเลย
จอช แอ็กเซลร็อด:ดังนั้นจึงมีกลุ่มผู้มีอิทธิพลที่สแตนฟอร์ดซึ่งได้สร้างชุดข้อมูลใหม่ที่เรียกว่า “กองกฎหมาย” โดยเน้นไปที่บริบททางกฎหมายและรัฐบาลโดยเฉพาะ ให้ฉันสำรองข้อมูล และบอกคุณเกี่ยวกับโมเดลพื้นฐาน ซึ่งพวกเขากำลังพยายามสร้างโมเดลพื้นฐานที่ดีกว่า โดยพื้นฐานแล้ว ถ้าคุณใช้เหมือนแถวของ Encyclopedia Britannica และคุณพยายามรวมมันทั้งหมดลงในเครื่อง แล้วจากนั้น ใช้เครื่องนั้นในการตัดสินใจ เรียนรู้บางสิ่งจากข้อมูลที่คุณให้ไว้ โมเดลพื้นฐานจำนวนมาก ซึ่งเป็นคำศัพท์ที่มาจากกลุ่ม Stanford นี้ และตอนนี้ใช้กันอย่างแพร่หลายทั่วทั้งอุตสาหกรรม พวกเขารับข้อมูลจากอินเทอร์เน็ตสาธารณะ ดังนั้นอินเทอร์เน็ต คุณก็รู้ว่าฉันเป็นแฟนของอินเทอร์เน็ตพอๆ กับผู้ชายคนต่อไป แต่ก็มีเรื่องแย่ๆ มากมายอยู่ที่นั่น และโมเดลพื้นฐานได้รับการฝึกฝนในอดีตโดยใช้โซเชียลมีเดีย, Wikipedia, Reddit ตัวอย่างเช่น ใช่ ถ้าคุณพยายามสอนแบบจำลองว่ามนุษย์พูดอย่างไร Facebook ก็จะเต็มไปด้วยคำพูดแสดงความเกลียดชัง และนั่นก็สามารถเข้ารหัสไวยากรณ์ที่ไม่ดีได้เช่นกัน ซึ่งคุณไม่สามารถมีในแบบจำลองได้ ดังนั้น นักวิจัยเหล่านี้จึงพยายามใช้ข้อมูลประเภทอื่น พวกเขาหันไปใช้ casebooks, รหัสกฎหมาย, เอกสารกำกับดูแล, อีกครั้ง, สิ่งต่างๆ ที่เหมาะสมกับบริบททางกฎหมายและของรัฐบาลเหล่านี้ เพื่อทำงานของการประมวลผลภาษาธรรมชาติได้อย่างมีประสิทธิภาพมากขึ้น ซึ่งจริงๆ แล้ว ที่ใช้อยู่ทั่วทั้งราชการแผ่นดินในขณะนี้
ทอม เทมิน:น่าสนใจ ดังนั้น ในบางวิธี พวกเขากำลังใช้วิธีการที่ IBM ทำเมื่อหลายปีก่อนกับโครงการที่พวกเขาเรียกว่า Watson ซึ่งพวกเขาจะนำเนื้อหาที่ผ่านการตรวจสอบแล้วทั้งหมดหรือเนื้อหาที่ผ่านการตรวจสอบโดยเพื่อนจากโดเมนที่กำหนดและใส่ลงในฐานข้อมูล พวกเขา มีปัญหาในการขาย ฉันไม่แน่ใจ
ว่ามันทำงานได้ดีเพียงใด มันชนะอันตราย แต่นั่นเป็นสิ่งที่ดูเหมือนที่นี่
Josh Axelrod:นั่นคือสิ่งที่พวกเขาทำคือรวบรวมคลังข้อมูลนี้ จริงๆแล้วมันมีขนาดมากกว่า 250 กิกะไบต์ และเป็นโอเพ่นซอร์สทั้งหมด ดังนั้นโปรแกรมเมอร์สามารถเข้ามาดูข้อมูลนั้น ปรับแต่งและใช้ข้อมูลนั้นเพื่อสร้างแบบจำลองของตนเอง และอีกครั้ง มันจะเหมาะสมกว่าสำหรับผู้ติดต่อด้านกฎระเบียบเหล่านี้ มีห้าประเด็นหลักที่รัฐบาลใช้ AI และการประมวลผลภาษาธรรมชาติ ซึ่งสิ่งนี้สามารถเพิ่มเติมได้
จอช แอ็กเซลร็อด:ใช่ นั่นจะเป็นการบังคับใช้ การตัดสิน การวิจัยด้านกฎระเบียบ บริการสาธารณะ และการจัดการภายใน การพิจารณาคดีเป็นเรื่องที่น่าสนใจมาก สำนักงานสิทธิบัตรและเครื่องหมายการค้าของสหรัฐฯ เป็นแนวหน้าในเรื่องนี้ ฉันได้พูดคุยกับ Jerry Ma ผู้อำนวยการฝ่ายเทคโนโลยีเกิดใหม่ และอีกครั้ง เขากล่าวว่าเขาเห็นบทบาทของ AI ในการเพิ่มพูนความเชี่ยวชาญของมนุษย์ในหน่วยงานนั้น ดังนั้นพวกเขาจึงใช้อัลกอริทึมเพื่อจัดการกับสิ่งที่เขาเรียกว่าปัญหาการกำหนดเส้นทางจดหมาย เพียงรับใบสมัครไว้ในมือของผู้ตรวจสอบที่เหมาะสม แต่ลดภาระของพนักงานที่นั่นลง พวกเขายังมีคลังศิลปะดิจิทัลขนาดใหญ่นี้ด้วย มันมีแต่จะใหญ่ขึ้นทุกวัน แน่นอนว่าเขาเป็นคนหน้าด้านเล็กน้อย แต่เขาบอกฉันว่าถ้าพวกเขาไม่นำโซลูชัน AI เข้ามา
Tom Temin:ใช่ ฉันเคยได้ยิน Jerry Ma พูดแบบนั้น แต่การเติบโตอย่างก้าวกระโดดในบางแหล่งที่พวกเขาต้องการสำหรับงานศิลปะยุคก่อน หมายความว่าพวกเขาต้องมีโซลูชันข่าวกรองประเภทอัตโนมัติ เพราะมีงานศิลปะยุคก่อนๆ มากมายในโลกนี้ เข้าใจแล้ว. เอาล่ะ. ดังนั้นโมเดลพื้นฐานนี้ กองกฎหมาย ซึ่งผมสามารถบอกได้ว่าทุกคนจะเรียกมันว่าอย่างไรในเร็วๆ นี้ เนื่องจากเรารักกฎหมายและนักกฎหมาย แต่มีให้สำหรับหน่วยงานใด ๆ ที่ต้องการใช้จาก Stanford?
credit : 3daysofsyllamo.org makedigitalworldeasy.org thaidiary.net flashpoetry.net coachfactoryoutletstoreco.com glimpsescience.net sylvanianvillage.com royalnepaleseembassy.org 21stcenturybackcare.com coachfactoryonlinea.net