'Angen gwell cydweithio' i wireddu potensial AI yn y Gymraeg
- Cyhoeddwyd
Mae datblygwyr technoleg yn galw am well cydweithio yng Nghymru er mwyn gwneud y mwyaf o'r cyfleoedd y gallai deallusrwydd artiffisial (AI) ei gynnig i'r Gymraeg.
Mae gallu'r sgwrsfot ChatGPT i gyfathrebu yn yr iaith yn dangos bod yr iaith yn "rhan o'r chwyldro AI", yn ôl ymchwilwyr.
Ond os yw'r "potensial enfawr" i gael ei wireddu, medden nhw, mae angen yr hawl i ddefnyddio'r deunydd Cymraeg sydd ar hyn o bryd o dan hawlfraint, i hyfforddi cyfrifiaduron.
Mae Llywodraeth Cymru'n dweud y bydd eu strategaeth Technoleg yn y Gymraeg yn cael ei hadnewyddu'n fuan.
'Gwallau o hyd'
Un busnes sydd eisoes yn defnyddio deallusrwydd artiffisial i gynnig gwasanaeth dwyieithog ydy cwmni Haia o Ynys Môn.
Mae'r cwmni'n trefnu digwyddiadau ar y we ac yn defnyddio meddalwedd cyfieithu ar y pryd i alluogi pobl i siarad yn Gymraeg neu Saesneg gydag isdeitlau.
Ond yn ôl un o'i sylfaenwyr, Tom Burke, gallai eu gwasanaeth fod yn well petai rhagor o ddata Cymraeg ar gael.
"Un o'r problemau rydan ni'n ei gael ydi pa mor gywir ydi'r cyfieithiad," meddai. "Os ti'n cymharu efo Almaeneg neu Sbaeneg, mae'r data yn y Gymraeg yn fychan.
"Yn aml, 'dan ni'n gweld gwallau yn y cyfieithiad neu'r trawsgrifiad, ac un ffordd o wella hynny ydi cael defnyddio'r cyfoeth o ddata sydd yna yn Gymraeg."
Mae deallusrwydd artiffisial iaith yn gweithio gyda modelau iaith cyfrifiadurol, sy'n defnyddio symiau enfawr o ddata fel gwefannau, llyfrau ac erthyglau i ddarogan pa eiriau sy'n tueddu i ddilyn ei gilydd.
Gallai data Cymraeg hefyd gynnwys rhaglenni radio a theledu.
"Petaen ni'n medru cael gafael ar y data yna, ei ddefnyddio i hyfforddi'r modelau iaith, yna buasai'r modelau iaith Cymraeg yn dod yn fwy cywir," meddai Mr Burke.
"Yn y tymor hir bydd hynny'n galluogi cwmnïau newydd i ffurfio, galluogi arloesi, a gallai Cymru ddod yn ganolbwynt ar gyfer technolegau iaith."
'Adlewyrchu realiti Cymru'
Un o'r sefydliadau sy'n helpu i hyfforddi a gwerthuso modelau iaith mawr yng Nghymru yw Canolfan Bedwyr ym Mhrifysgol Bangor.
Lansiodd yr Uned Technolegau Iaith yno brototeip sgwrsfot Cymraeg, Macsen, wyth mlynedd yn ôl gan ddefnyddio technolegau lleferydd-i-destun a chynhyrchu iaith naturiol.
Maen nhw bellach yn ei redeg gyda ChatGPT, a ddatblygwyd gan OpenAI yn yr UDA.
Yn ogystal â'r potensial economaidd mae pennaeth yr uned, Gruffydd Prys, yn teimlo y dylai deunydd Cymraeg fod ar gael er mwyn helpu i wneud y dechnoleg yn fwy "addas ar gyfer anghenion y Gymraeg a Chymru yn gyffredinol".
"Un o'r pethau y gallwn ei wneud i wella ansawdd deallusrwydd artiffisial yw galluogi'r data sydd allan yna i fod ar gael o dan drwyddedau caniataol, fel bod y modelau'n adlewyrchu realiti Cymru ac nad ydyn nhw'n fodelau rhy Americanaidd neu ryngwladol," meddai Mr Prys.
Dywedodd Tom Burke fod angen i fynediad at y data ddigwydd yn fuan.
"'Dan ni eisoes wedi colli 12 mis o amser arloesi, a'r hyn fydd yn digwydd yn y pen draw yw y byddwn ni ar ei hôl hi," meddai.
"Ar y pwynt y gallwn ni ddechrau ei ddefnyddio, bydd gweddill y byd wedi ei ddatblygu hefyd.
"Mae gennym ni'r sefyllfa wych hon, mae gennym ni'r wlad ddwyieithog hon. Mae gennym ni brifysgol wych fel Bangor yn gweithio ar y dechnoleg hon. Mae angen i ni wneud hyn nawr fel y gall cwmnïau ddechrau ei ddefnyddio a mynd allan yno."
'Wir yn bwysig'
Dywedodd y gweinidog sy'n gyfrifol am y Gymraeg yn Llywodraeth Cymru, Jeremy Miles AS, bod deallusrwydd artiffisial yn y Gymraeg "wir yn bwysig".
"Mae'n rhan bwysig o'r strategaeth Technoleg yn y Gymraeg sydd gyda ni eisoes," meddai.
"Ni ar fin adnewyddu honno ar gyfer y cyfnod nesaf.
"Dros y blynyddoedd diwethaf ni wedi gwario £2m ar sicrhau bod y Gymraeg reit yng nghanol yr agenda hon, ac mae'n parhau'n flaenoriaeth bwysig i ni yn y dyfodol."
Pynciau cysylltiedig
Straeon perthnasol
- Cyhoeddwyd12 Mehefin 2023
- Cyhoeddwyd13 Awst 2023
- Cyhoeddwyd9 Ebrill 2023
- Cyhoeddwyd18 Ionawr 2023