ML To'liqligini Tekshirish Ro'yxati

2025 Muallif: Timothy Dodson | [email protected]. Oxirgi o'zgartirilgan: 2025-01-22 21:43

Reproduktivlikni oshirish va boshqalarga nashr etilgan ishlarni osonroq qurish imkoniyatini berish maqsadida biz ML kodining to'liqligini tekshirish ro'yxatini taqdim etamiz. ML kodining to'liqligini tekshirish ro'yxati unda saqlangan skriptlar va artefaktlar asosida kodlar do'konini baholaydi.

ML kodining to'liqligini tekshirish ro'yxati

Kirish

O'tgan yili Joel Pino OA konferentsiyalarida (NeurIPS, ICML,…) taqdim etiladigan takrorlanuvchi tadqiqotlarni osonlashtirish uchun takrorlanuvchanlikni nazorat ro'yxatini chiqardi. Tekshirish ro'yxatidagi elementlarning aksariyati qog'oz tarkibiy qismlariga qaratilgan. Ushbu tekshiruv ro'yxatidagi bitta narsa "manba kodiga havolani taqdim eting", ammo bundan tashqari, ozgina tavsiyalar berilgan.

Eng yaxshi amaliyotlar ML kodining to'liqligini tekshirish ro'yxatida umumlashtirildi, bu endi NeurIPS 2020 kodini rasmiy yuborish jarayonining bir qismi bo'lib, sharhlovchilar o'zlari xohlaganicha foydalanishlari mumkin.

ML to'liqligini tekshirish ro'yxati

M kodi to'liqligini tekshirish ro'yxati kod do'konini tekshiradi:

Bog'liqliklar - omborda qaramlik to'g'risidagi ma'lumot yoki atrof-muhitni sozlash bo'yicha ko'rsatmalar bormi?
O'quv stsenariylari - omborda hujjatda tasvirlangan modellarni tayyorlash / moslashtirish usuli mavjudmi?
Baholash stsenariylari - omborda o'qitilgan model (lar) ning ishlash ko'rsatkichlarini hisoblash yoki modellarda tajribalar o'tkazish uchun stsenariy mavjudmi?
Oldindan tayyorlangan modellar - omborxona oldindan tayyorlangan model og'irliklariga bepul kirishni ta'minlaydimi?
Omborda asosiy natijalar jadvali / grafigi va ushbu natijalarni ko'paytirish uchun skript mavjudmi?

Har bir ombor 0 (yo'q) dan 5 gacha (barchasi bor) Shomilni qabul qilishi mumkin. Har bir element mezonlari haqida ko'proq ma'lumotni Github omborida topishingiz mumkin.

Tekshiruvlar ro'yxati foydali omborlarga yordam beradigan dalillar nimada?

Jamiyat odatda GitHub yulduzlarini omborning foydaliligi uchun proksi sifatida ishlatadi. Shuning uchun, ML to'liqligini nazorat qilish ro'yxatida yuqori ball to'plagan repolarda GitHub yulduzlari ko'proq bo'lishi kutilmoqda. Ushbu gipotezani sinab ko'rish uchun NeurIPS 2019 hujjatlarida rasmiy dastur sifatida 884 GitHub repo taqdim etilgan edi. Ushbu 884 reponing 25% to'plami tasodifiy tanlangan va ML to'liqligi nazorat ro'yxatida qo'lda tekshirilgan. Ular ushbu namunadagi NeurIPS 2019 GitHub reposlarini ML kodining to'liqligini tekshirish ro'yxatidagi Shomil soni bo'yicha guruhlashdi va har bir guruhdagi GitHub median yulduzlarini xaritaga tushirishdi. Natija quyida:

0 katakchali NeurIPS 2019 reposlari GitHub-da 1,5 yulduz medianasiga ega edi. Aksincha, 5 ta katakchali reposlar 196,5 GitHub yulduzidan iborat edi. Repolarning atigi 9 foizida 5 ta, repolarning aksariyatida (70 foizida) 3 yoki undan kam Shomil bor edi. Wilcoxon martabali yig'indisi testi o'tkazildi va 5 ta Shomil sinfidagi yulduzlar soni 5 ga nisbatan 4 ga nisbatan boshqa barcha sinflarga qaraganda sezilarli darajada (p.value <1e-4) ko'pligini aniqladi (bu erda p.value chegara). 0,015 da). Ushbu raqam uchun ma'lumotlar va kodni Github omborida ko'rishingiz mumkin.

Ushbu munosabatlar yanada kengroq kengayib borayotganligini tekshirish uchun README omboridan va tegishli koddan tekshiruv ro'yxatini hisoblashni avtomatlashtirish uchun skript yaratildi. Keyinchalik biz 884 NeurIPS 2019 omborlari to'plamini va shuningdek, 2019 yilda nashr etilgan barcha ML maqolalari uchun 8926 kodli omborlarni qayta tahlil qildik. Ikkala holatda ham, mutaxassislar statik jihatdan muhim bo'lgan Shomillardan monotonik ravishda ko'payadigan o'rtacha yulduzlar bilan sifat jihatidan bir xil natijaga erishdilar (p.value <1e-4). Va nihoyat, mustahkam chiziqli regressiyadan foydalanib, oldindan tayyorlangan modellar va natijalarni GitHub yulduzlariga eng katta ijobiy ta'sir ko'rsatadigan natijalarni topdik.

Bu tahlilchilar tomonidan tadqiqotchilarni ML-ning to'liqligini tekshirish ro'yxati talab qiladigan barcha tarkibiy qismlarni kiritishga undash yanada foydali omborlarga olib kelishini va tekshiruvlar ro'yxatidagi ballar sifatli materiallarni taqdim etishini ko'rsatadigan foydali dalillar deb hisoblanadi.

Hozirgi vaqtda ekspertlar taklif qilingan 5 ta nazorat ro'yxati ombori mashhurligining yagona yoki hatto eng muhim omili ekanligini da'vo qilmaydilar. Boshqa omillar mashhurlikka ta'sir qilishi mumkin, masalan: ilmiy hissa hajmi, marketing (masalan, blogdagi xabarlar va Twitter postlari), hujjatlar (keng qamrovli README'lar, o'quv qo'llanmalari va API hujjatlari), kod sifati va oldingi ish.

5 ta katakchali NeurIPS 2019 omborlarining ba'zi bir misollari:

Mutaxassislarning ta'kidlashicha, ular nazorat ro'yxatini iloji boricha umumiy qilib olishga harakat qilgan bo'lsalar-da, ammo bu hujjatlar barcha turlariga, masalan, nazariy yoki hujjatlar to'plamiga to'liq tatbiq etilmasligi mumkin. Ammo, agar maqolaning asosiy maqsadi ma'lumotlar to'plamini namoyish etish bo'lsa ham, u dastlabki stsenariylarni, shu jumladan o'quv stsenariylarini, baholash stsenariylarini va natijalarini chiqarishda foyda ko'rishi mumkin.

Foydalanishni boshlang

Sharhlovchilar va foydalanuvchilar omborda nima borligini tushunishlari va mutaxassislar uni to'g'ri baholashlarini osonlashtirish uchun README.md fayllarini yozish, bog'liqliklarni aniqlash va oldindan tayyorlangan modellar, ma'lumotlar to'plamlari va natijalarni chiqarish uchun eng yaxshi amaliyotlar to'plami taqdim etiladi. O'zingizning omboringizda ushbu 5 elementni aniq belgilashingiz va foydalanuvchilaringiz uchun ko'proq kontekst va ravshanlikni ta'minlash uchun ularni hujjatlar va etakchilar jadvallari kabi har qanday tashqi manbalarga bog'lashingiz tavsiya etiladi. Bu NeurIPS 2020-ga kodni taqdim etish bo'yicha rasmiy ko'rsatmalar.

Tavsiya:

Domolinka-da Hisobni Qanday Tekshirish Mumkin

Ehtimol, Internet yoki televizorni har qanday provayderdan yangi ulagan odamlarni xavotirga soladigan eng dolzarb savol - bu ularning hisobidagi qoldiqni qanday tekshirish. Agar siz Domolink xizmatlaridan foydalansangiz, buni quyidagicha qilishingiz mumkin

Sims 3: Barcha Qo'shimchalar Va Ularning Har Birining Xususiyatlari Ro'yxati

Sims seriyali o'yinlari uzoq vaqt davomida geymerlar va tanqidchilarning mehrini qozongan. Hozirda bu o'yin sohasidagi eng mashhur hayot simulyatori. Agar xohlasangiz, o'yinchi Sim uchun deyarli har qanday hayotni yaratishi mumkin, boy va baxtli belgidan tortib, to'lovlarni to'lay olmaydigan yutqazuvchigacha

Windows Ro'yxatga Olish Kitobidagi Ishga Tushirish Ro'yxati Qayerda

Windows 7 operatsion tizimidan dasturlarni o'chirish, Microsoft operatsion tizimlari uchun standart bo'lgan Registry Editor dasturidagi ro'yxatga olish kitobi sozlamalarini tahrirlash orqali amalga oshirilishi mumkin. Ushbu dastur tizim registrining qiymatlarini boshqarish uchun etarlicha vositalarni taklif qiladi va ishga tushirish parametrlarini tahrirlashga imkon beradi

Fayllarni Ro'yxati Qanday

Ba'zan siz qattiq diskdagi yoki bo'limdagi kataloglardan biridan fayllar ro'yxatini olishni xohlaysiz. Ushbu vazifani bajarish uchun ko'plab zamonaviy dasturiy vositalardan yoki mavjud tizim qobig'iga ba'zi qo'shimchalardan foydalanish mumkin (ro'yxatga olish kitobi kalitlarini o'zgartirish)

Qanday Qilib Papkalar Ro'yxati Tuziladi

Bu juda g'alati, ammo Windows OS-ning grafik interfeysida matn formatida biron bir katalogning papkalari yoki fayllari ro'yxatini olish uchun vosita yo'q. Bunday funktsiyani fayl menejerida (Explorer) biror joyda bo'lishi mantiqan to'g'ri bo'lar edi, lekin siz u erda topa olmaysiz

ML To'liqligini Tekshirish Ro'yxati

Mundarija:

Kirish

ML to'liqligini tekshirish ro'yxati

Tekshiruvlar ro'yxati foydali omborlarga yordam beradigan dalillar nimada?

Foydalanishni boshlang

Tavsiya:

Domolinka-da Hisobni Qanday Tekshirish Mumkin

Sims 3: Barcha Qo'shimchalar Va Ularning Har Birining Xususiyatlari Ro'yxati

Windows Ro'yxatga Olish Kitobidagi Ishga Tushirish Ro'yxati Qayerda

Fayllarni Ro'yxati Qanday

Qanday Qilib Papkalar Ro'yxati Tuziladi

Mening Wi-Fi-ga Kim Ulanganligini Qanday Aniqlash Mumkin

Qurt Virusini Qanday Olib Tashlash Mumkin

Troyan Otidan Qanday Qutulish Mumkin

Kasperskiy Antivirusini Kompyuteringizdan Qanday Qilib Butunlay Olib Tashlash Mumkin

Spirtli Ichimliklar Dasturini Qanday O'rnatish

Hujjatni So'z Bilan Qanday Qisqartirish Kerak

Taqdimotingizga Qanday Matn Kiritish Mumkin

Word-ga Rasmni Qanday Kiritish Kerak

Windows 8-da Devor Qog'ozini Qanday O'zgartirish Mumkin

Windows 7 Fon Rasmlarini Qanday O'zgartirish Mumkin

Qattiq Diskni Formatlashdan Keyin Ma'lumotlarni Qanday Tiklash Mumkin

Kompyuterning Virtual Xotirasini Qanday Tozalash Kerak

BIOS-da Video Kartani Qanday O'zgartirish Mumkin

Kompyuterni Mahalliy Tarmoqqa Qanday Ulash Mumkin

Anakart Ishlayotganligini Qanday Tekshirish Mumkin