សូមកុំឱ្យការផ្ទុកក្លាយជាចំណុចសំខាន់ក្នុងការបណ្តុះបណ្តាលគំរូ

វាត្រូវបានគេនិយាយថាក្រុមហ៊ុនបច្ចេកវិទ្យាកំពុងប្រជែងយក GPUs ឬនៅលើផ្លូវដើម្បីទទួលបានពួកគេ។កាលពីខែមេសា នាយកប្រតិបត្តិក្រុមហ៊ុន Tesla លោក Elon Musk បានទិញ GPU ចំនួន 10,000 ហើយបាននិយាយថា ក្រុមហ៊ុននឹងបន្តទិញ GPU មួយចំនួនធំពី NVIDIA ។ខាងសហគ្រាស បុគ្គលិកផ្នែកព័ត៌មានវិទ្យាក៏កំពុងជំរុញយ៉ាងខ្លាំងដើម្បីធានាថា GPUs ត្រូវបានប្រើប្រាស់ឥតឈប់ឈរ ដើម្បីបង្កើនផលត្រឡប់មកវិញលើការវិនិយោគ។ទោះយ៉ាងណាក៏ដោយ ក្រុមហ៊ុនមួយចំនួនអាចរកឃើញថាខណៈពេលដែលចំនួន GPUs កើនឡើង ភាពទំនេររបស់ GPU កាន់តែធ្ងន់ធ្ងរ។

ប្រសិនបើប្រវតិ្តសាស្រ្តបានបង្រៀនយើងពីអ្វីទាំងអស់អំពីកុំព្យូទ័រដែលមានប្រសិទ្ធភាពខ្ពស់ (HPC) នោះ គឺថាការផ្ទុក និងបណ្តាញមិនគួរត្រូវបានលះបង់ដោយចំណាយលើការផ្តោតអារម្មណ៍ច្រើនពេកលើការគណនានោះទេ។ប្រសិនបើទំហំផ្ទុកមិនអាចផ្ទេរទិន្នន័យប្រកបដោយប្រសិទ្ធភាពទៅអង្គភាពកុំព្យូទ័រ បើទោះបីជាអ្នកមាន GPU ច្រើនបំផុតក្នុងពិភពលោកក៏ដោយ អ្នកនឹងមិនអាចទទួលបានប្រសិទ្ធភាពល្អបំផុតនោះទេ។

យោងតាមលោក Mike Matchett អ្នកវិភាគនៅ Small World Big Data ម៉ូដែលតូចៗអាចត្រូវបានប្រតិបត្តិក្នុងអង្គចងចាំ (RAM) ដែលអនុញ្ញាតឱ្យផ្តោតលើការគណនាកាន់តែច្រើន។ទោះជាយ៉ាងណាក៏ដោយ ម៉ូដែលធំៗដូចជា ChatGPT ដែលមានថ្នាំងរាប់ពាន់លានមិនអាចរក្សាទុកក្នុងអង្គចងចាំបានទេ ដោយសារតម្លៃខ្ពស់។

Mattett និយាយថា "អ្នកមិនអាចដាក់ថ្នាំងរាប់ពាន់លាននៅក្នុងអង្គចងចាំបានទេ ដូច្នេះការផ្ទុកកាន់តែសំខាន់" Mattett និយាយថា។ជាអកុសល ការផ្ទុកទិន្នន័យជារឿយៗត្រូវបានមើលរំលងក្នុងអំឡុងពេលដំណើរការធ្វើផែនការ។

ជាទូទៅ ដោយមិនគិតពីករណីប្រើប្រាស់នោះទេ មានចំណុចទូទៅចំនួនបួននៅក្នុងដំណើរការបណ្តុះបណ្តាលគំរូ៖

1. ការបណ្តុះបណ្តាលគំរូ
2. ការអនុវត្តការសន្និដ្ឋាន
3. ការផ្ទុកទិន្នន័យ
4. ការបង្កើនល្បឿនកុំព្យូទ័រ

នៅពេលបង្កើត និងដាក់ពង្រាយគំរូ តម្រូវការភាគច្រើនផ្តល់អាទិភាពដល់ការបញ្ជាក់អំពីគំនិតរហ័ស (POC) ឬបរិយាកាសសាកល្បង ដើម្បីផ្តួចផ្តើមការបណ្តុះបណ្តាលគំរូ ដោយតម្រូវការផ្ទុកទិន្នន័យមិនត្រូវបានផ្តល់ការពិចារណាកំពូលនោះទេ។

ទោះជាយ៉ាងណាក៏ដោយ បញ្ហាប្រឈមស្ថិតនៅក្នុងការពិតដែលថាការបណ្តុះបណ្តាល ឬការដាក់ពង្រាយការសន្និដ្ឋានអាចមានរយៈពេលរាប់ខែ ឬរាប់ឆ្នាំ។ក្រុមហ៊ុនជាច្រើនបង្កើនទំហំគំរូរបស់ពួកគេយ៉ាងឆាប់រហ័សក្នុងអំឡុងពេលនេះ ហើយហេដ្ឋារចនាសម្ព័ន្ធត្រូវតែពង្រីកដើម្បីសម្រុះសម្រួលគំរូ និងសំណុំទិន្នន័យដែលកំពុងរីកចម្រើន។

ការស្រាវជ្រាវពី Google លើបន្ទុកការងារបណ្តុះបណ្តាល ML រាប់លានបង្ហាញថាជាមធ្យម 30% នៃពេលវេលាបណ្តុះបណ្តាលត្រូវបានចំណាយលើបណ្តាញបញ្ចូលទិន្នន័យ។ខណៈពេលដែលការស្រាវជ្រាវកន្លងមកបានផ្តោតលើការបង្កើនប្រសិទ្ធភាព GPUs ដើម្បីបង្កើនល្បឿនការបណ្តុះបណ្តាល បញ្ហាប្រឈមជាច្រើននៅតែមាននៅក្នុងការធ្វើឱ្យប្រសើរផ្នែកផ្សេងៗនៃបំពង់បង្ហូរទិន្នន័យ។នៅពេលដែលអ្នកមានថាមពលគណនាយ៉ាងសំខាន់ ភាពជាប់គាំងពិតប្រាកដនឹងក្លាយទៅជាល្បឿនដែលអ្នកអាចបញ្ចូលទិន្នន័យទៅក្នុងការគណនាដើម្បីទទួលបានលទ្ធផល។

ជាពិសេស បញ្ហាប្រឈមក្នុងការផ្ទុកទិន្នន័យ និងការគ្រប់គ្រងទាមទារឱ្យមានផែនការសម្រាប់កំណើនទិន្នន័យ ដែលអនុញ្ញាតឱ្យអ្នកទាញយកតម្លៃនៃទិន្នន័យជាបន្តបន្ទាប់ នៅពេលអ្នករីកចម្រើន ជាពិសេសនៅពេលដែលអ្នកចូលទៅក្នុងករណីប្រើប្រាស់កម្រិតខ្ពស់បន្ថែមទៀត ដូចជាការរៀនជ្រៅជ្រះ និងបណ្តាញសរសៃប្រសាទ ដែលទាមទារឱ្យមានតម្រូវការខ្ពស់ជាងមុន។ ការផ្ទុកនៅក្នុងលក្ខខណ្ឌនៃសមត្ថភាព, ការអនុវត្ត, និងការធ្វើមាត្រដ្ឋាន។

ជាពិសេស:

លទ្ធភាពធ្វើមាត្រដ្ឋាន
ការរៀនម៉ាស៊ីនទាមទារការគ្រប់គ្រងទិន្នន័យយ៉ាងច្រើន ហើយនៅពេលដែលបរិមាណទិន្នន័យកើនឡើង ភាពត្រឹមត្រូវនៃគំរូក៏ប្រសើរឡើងផងដែរ។នេះមានន័យថាអាជីវកម្មត្រូវតែប្រមូល និងរក្សាទុកទិន្នន័យបន្ថែមទៀតជារៀងរាល់ថ្ងៃ។នៅពេលដែលទំហំផ្ទុកមិនអាចធ្វើមាត្រដ្ឋានបានទេ បន្ទុកការងារដែលពឹងផ្អែកលើទិន្នន័យបង្កើតការរាំងស្ទះ កម្រិតប្រតិបត្តិការ និងបណ្តាលឱ្យចំណាយពេលវេលាទំនេរ GPU ។

ភាពបត់បែន
ការគាំទ្រដែលអាចបត់បែនបានសម្រាប់ពិធីការច្រើន (រួមទាំង NFS, SMB, HTTP, FTP, HDFS និង S3) គឺចាំបាច់ដើម្បីបំពេញតម្រូវការនៃប្រព័ន្ធផ្សេងៗគ្នា ជាជាងត្រូវបានកំណត់ចំពោះប្រភេទបរិស្ថានតែមួយ។

ភាពយឺតយ៉ាវ
ភាពយឺតយ៉ាវរបស់ I/O គឺមានសារៈសំខាន់សម្រាប់ការបង្កើត និងប្រើប្រាស់គំរូ ដោយសារទិន្នន័យត្រូវបានអាន និងអានឡើងវិញច្រើនដង។ការកាត់បន្ថយភាពយឺតយ៉ាវ I/O អាចកាត់បន្ថយរយៈពេលបណ្តុះបណ្តាលរបស់ម៉ូដែលដោយថ្ងៃ ឬខែ។ការអភិវឌ្ឍន៍គំរូលឿនជាងមុន បកប្រែដោយផ្ទាល់ទៅអត្ថប្រយោជន៍អាជីវកម្មកាន់តែច្រើន

ឆ្លងកាត់
ដំណើរការនៃប្រព័ន្ធផ្ទុកទិន្នន័យមានសារៈសំខាន់ណាស់សម្រាប់ការបណ្តុះបណ្តាលគំរូប្រកបដោយប្រសិទ្ធភាព។ដំណើរការបណ្តុះបណ្តាលពាក់ព័ន្ធនឹងចំនួនទិន្នន័យធំ ជាធម្មតាគិតជាតេរ៉ាបៃក្នុងមួយម៉ោង។

ការចូលប្រើប៉ារ៉ាឡែល
ដើម្បីសម្រេចបានលទ្ធផលខ្ពស់ គំរូបណ្តុះបណ្តាលបានបំបែកសកម្មភាពទៅជាកិច្ចការស្របគ្នាជាច្រើន។នេះច្រើនតែមានន័យថា ក្បួនដោះស្រាយការរៀនម៉ាស៊ីនចូលប្រើឯកសារដូចគ្នាពីដំណើរការជាច្រើន (មានសក្តានុពលលើម៉ាស៊ីនមេច្រើន) ក្នុងពេលដំណាលគ្នា។ប្រព័ន្ធផ្ទុកត្រូវតែដោះស្រាយការទាមទារក្នុងពេលដំណាលគ្នាដោយមិនប៉ះពាល់ដល់ដំណើរការ។

ជាមួយនឹងសមត្ថភាពដ៏លេចធ្លោរបស់វានៅក្នុងភាពយឺតយ៉ាវទាប លំហូរខ្ពស់ និង I/O ប៉ារ៉ាឡែលខ្នាតធំ Dell PowerScale គឺជាការបន្ថែមទំហំផ្ទុកដ៏ល្អសម្រាប់កុំព្យូទ័រដែលបង្កើនល្បឿន GPU ។PowerScale មានប្រសិទ្ធភាពកាត់បន្ថយពេលវេលាដែលត្រូវការសម្រាប់គំរូការវិភាគដែលបណ្តុះបណ្តាល និងសាកល្បងសំណុំទិន្នន័យពហុតេរ៉ាបៃ។នៅក្នុង PowerScale all-flash storage, bandwidth កើនឡើង 18 ដង បំបាត់ការស្ទះ I/O ហើយអាចត្រូវបានបន្ថែមទៅក្រុម Isilon ដែលមានស្រាប់ ដើម្បីបង្កើនល្បឿន និងដោះសោតម្លៃនៃទិន្នន័យដែលមិនមានរចនាសម្ព័ន្ធច្រើន។

ជាងនេះទៅទៀត សមត្ថភាពចូលដំណើរការពហុពិធីការរបស់ PowerScale ផ្តល់នូវភាពបត់បែនគ្មានដែនកំណត់សម្រាប់ការដំណើរការបន្ទុក ដែលអនុញ្ញាតឱ្យទិន្នន័យត្រូវបានរក្សាទុកដោយប្រើពិធីការមួយ និងចូលប្រើដោយប្រើប្រាស់មួយផ្សេងទៀត។ជាពិសេស មុខងារដ៏មានឥទ្ធិពល ភាពបត់បែន ការធ្វើមាត្រដ្ឋាន និងមុខងារថ្នាក់សហគ្រាសនៃវេទិកា PowerScale ជួយដោះស្រាយបញ្ហាប្រឈមដូចខាងក្រោម៖

- បង្កើនល្បឿនការបង្កើតថ្មីរហូតដល់ 2.7 ដង កាត់បន្ថយវដ្តនៃការបណ្តុះបណ្តាលគំរូ។

- លុបបំបាត់ការជាប់គាំង I/O និងផ្តល់នូវការបណ្តុះបណ្តាលគំរូ និងសុពលភាពលឿនជាងមុន ភាពត្រឹមត្រូវនៃគំរូដែលប្រសើរឡើង ផលិតភាពវិទ្យាសាស្ត្រទិន្នន័យប្រសើរឡើង និងទទួលបានមកវិញជាអតិបរមាលើការវិនិយោគលើកុំព្យូទ័រដោយប្រើប្រាស់លក្ខណៈពិសេសកម្រិតសហគ្រាស ដំណើរការខ្ពស់ ភាពស្របគ្នា និងលទ្ធភាពធ្វើមាត្រដ្ឋាន។បង្កើនភាពត្រឹមត្រូវនៃគំរូជាមួយនឹងសំណុំទិន្នន័យកាន់តែស៊ីជម្រៅ និងគុណភាពបង្ហាញខ្ពស់ ដោយប្រើប្រាស់រហូតដល់ 119 PB នៃសមត្ថភាពផ្ទុកប្រកបដោយប្រសិទ្ធភាពនៅក្នុងចង្កោមតែមួយ។

- សម្រេចបាននូវការដាក់ពង្រាយតាមមាត្រដ្ឋាន ដោយចាប់ផ្តើមធ្វើមាត្រដ្ឋានកុំព្យូទ័រ និងការផ្ទុកតូច និងដោយឯករាជ្យ ដោយផ្តល់នូវការការពារទិន្នន័យ និងជម្រើសសុវត្ថិភាពដ៏រឹងមាំ។

- ធ្វើឱ្យប្រសើរឡើងនូវផលិតភាពវិទ្យាសាស្ត្រទិន្នន័យជាមួយនឹងការវិភាគនៅនឹងកន្លែង និងដំណោះស្រាយដែលមានសុពលភាពជាមុនសម្រាប់ការដាក់ឱ្យប្រើប្រាស់លឿនជាងមុន និងមានហានិភ័យទាប។

- ប្រើប្រាស់ការរចនាដែលបង្ហាញឱ្យឃើញដោយផ្អែកលើបច្ចេកវិទ្យាល្អបំផុត រួមទាំងការបង្កើនល្បឿន NVIDIA GPU និងស្ថាបត្យកម្មយោងជាមួយនឹងប្រព័ន្ធ NVIDIA DGX ។ដំណើរការ និងរូបិយវត្ថុខ្ពស់របស់ PowerScale បំពេញតាមតម្រូវការនៃដំណើរការផ្ទុកនៅគ្រប់ដំណាក់កាលនៃការរៀនម៉ាស៊ីន ចាប់ពីការទទួលបានទិន្នន័យ និងការរៀបចំរហូតដល់ការបណ្តុះបណ្តាលគំរូ និងការសន្និដ្ឋាន។រួមជាមួយនឹងប្រព័ន្ធប្រតិបត្តិការ OneFS ថ្នាំងទាំងអស់អាចដំណើរការយ៉ាងរលូននៅក្នុងចង្កោមដែលជំរុញដោយ OneFS ដូចគ្នា ជាមួយនឹងលក្ខណៈពិសេសកម្រិតសហគ្រាសដូចជាការគ្រប់គ្រងការអនុវត្ត ការគ្រប់គ្រងទិន្នន័យ សុវត្ថិភាព និងការការពារទិន្នន័យ ដែលអនុញ្ញាតឱ្យបញ្ចប់ការបណ្តុះបណ្តាលគំរូ និងសុពលភាពកាន់តែលឿនសម្រាប់អាជីវកម្ម។


ពេលវេលាផ្សាយ៖ កក្កដា-០៣-២០២៣