
Mikä tekee DeepSeekistä erityisen, on se, että se on ilmeisesti paljon halvempi. Vaikka alan johtajan OpenAI: n kerrotaan käyttäneen yli 100 miljoonaa dollaria GPT-4: n kehittämiseen, DeepSeek kehitti mallinsa 6 miljoonasta dollarista. Tämä kustannusetu saavutettiin käyttämällä huippuluokan Nvidia A100 -siruja yhdessä muiden suhteellisen halvempien prosessorien kanssa.
Asiantuntijat väittävät , että tämä luku on harhaanjohtava, koska siinä ei oteta huomioon laajempia tutkimus- ja kehityskustannuksia, tiedonkeruuta, henkilöstökuluja, infrastruktuurikustannuksia ja laitteistoinvestointeja.
Suorituskyky ja ominaisuudet
Aivan kuten ChatGPT, DeepSeek toimii tarjoamalla vastauksia kysymyksiin, ja se on verrattavissa OpenAI: n o1-malliin matematiikassa ja koodauksessa. Se on ”päättelymalli”, joka ajattelee ja reagoi kuten ihmiset, mikä tekee siitä erityisen hyödyllisen liike- ja asiakaspalvelutarkoituksiin.

Performance compared Source: Artificial Analysis Graphic: Jasmine Cui and Joe Murphy / NBC News
Järjestelmä on erityisen hyvä osoittamaan päättelyprosessinsa ongelman ratkaisemisessa jakamalla päättelyprosessinsa vaiheittain. Se voi myös, kuten palapeliä ratkaiseva ihminen, jäljittää logiikkansa läpi ja korjata aiempia vaiheita tarvittaessa.
Tämän avoimen lähestymistavan avulla käyttäjät tietävät, miten se laatii suosituksensa.
DeepSeek herättää eettisiä huolenaiheita
DeepSeekin nousu tekoälymaisemassa herättää tärkeitä kysymyksiä sen teknologian seurauksista, varsinkin kun otetaan huomioon, että se on koulutettu kalliiden laitteistojen selkärankaan, joka on saatettu kehittää rikkomaan Yhdysvaltojen vientivalvontaa.
Vaikka sen R1-mallin suorituskyky, joka pystyy toistamaan OpenAI: n o1: n toiminnallisuuden, mutta murto-osalla kustannuksista, on vaikuttava, se paljastaa myös valvonnan tai epäeettisten käytäntöjen mahdollisuuden tekoälyn kehittämisessä muualla maailmassa.
Yhtiön kyky sisällyttää onnistuneesti Nvidia A100 -sirut, joita aiemmin rajoitettiin Yhdysvaltain säännöksillä, on punainen lippu yrityksen aitoudesta ja siitä, miten tällaisia tekniikoita voidaan käyttää kansainvälisen järjestyksen horjuttamiseen.
Lisäksi DeepSeekin arkaluonteisiin historiallisiin tapahtumiin antamien vastausten yhdenmukaisuus Kiinan hallituksen sensuurin kanssa on huolestuttavaa, koska se osoittaa, että mallia voitaisiin käyttää tukemaan valtion valvomia kertomuksia, mikä voisi rajoittaa mallin hyödyllisyyttä ja uskottavuutta maailmanlaajuisesti.
Näin ollen, kun markkinat reagoivat tähän havaittuun uhkaan amerikkalaiselle teknologiselle ylivallalle, DeepSeekin strategian laajemmat vaikutukset – innovatiivinen mutta moraalisesti järkevä – on analysoitava perusteellisesti.