Pojdi na vsebino

DeepSeek

Iz Wikipedije, proste enciklopedije
Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.
Domače ime
杭州深度求索人工智能基础技术研究有限公司
TipZasebna družba
PanogaInformacijske tehnologije
Umetna inteligenca
Ustanovitev17. julij 2023 (2023-07-17)
UstanoviteljLiang Wenfeng
SedežHangdžov, Kitajska
LastnikHigh-Flyer
Št. zaposlenih< 200
Spletna strandeepseek.com

DeepSeek je kitajsko zagonsko podjetje, specializirano za razvoj naprednih langovnih modelov in umetne inteligence. Podjetje je januarja 2025 pridobilo mednarodno pozornost z izdajo modela DeepSeek R1, ki tekmuje s podobnimi sistemi z umetno inteligenco podprtih klepetalnikov, kot npr. ChatGPT podjetja OpenAI. Podjetje v celoti financira kitajski sklad tveganih naložb High-Flyer, pri čemer imata obe podjetji sedež v Hangdžovu.

Zgodovina

[uredi | uredi kodo]

Leta 2015 je bil sklad High-Flyer ustanovljen s strani treh inženirjev Univerze v Džedžjangu, ki so med svetovno finančno krizo 2007–2008 kot študenti pridobili prve izkušnje s trgovanjem na borzi.[1] High-Flyer se je hitro uveljavil kot inovativni akter v finančnem sektorju, saj je uporabljal strojno učenje za optimizacijo trgovalnih strategij in razvil model umetne inteligence za visokofrekvenčno trgovanje. Leta 2021 je Liang Wenfeng, eden od treh ustanoviteljev High-Flyerja, začel raziskovalno skupino za temeljne raziskave umetne inteligence, ki jo je financiral High-Flyer kot stranski projekt.[2]

Aprila 2023 je Liang Wenfeng objavil, da bo raziskovalno skupino ločil in ustanovil neodvisno podjetje za umetno inteligenco, imenovano DeepSeek. Cilj podjetja naj bi bil razvoj in komercializacija univerzalne umetne inteligence na podlagi lastnega velikega jezikovnega modela.[3]

DeepSeek si prizadeva zagotoviti zmogljivo in konkurenčno alternativo tujim rešitvam umetne inteligence ter hkrati okrepiti tehnološko suverenost Kitajske. Že v zgodnji fazi delovanja je podjetje pridobilo znatno finančno podporo iz kitajske tehnološke industrije in državnih inovacijskih programov. Po besedah Lianga Wenfenga bodo raziskovalni rezultati in modeli podjetja vedno objavljeni pod odprtokondnimi licencami.[4]

V luči ameriških izvoznih omejitev proti Kitajski, ki omejujejo uvoz zmogljivih pospeševalnikov za treniranje umetne inteligence, so bili ustvarjeni dodatni spodbujevalni mehanizmi za razvoj bolj učinkovitih modelov umetne inteligence.[5]

Ko so mediji razkrili zmogljivosti modela DeepSeek pri relativno nizkih investicijah, so konec januarja 2025 delnice številnih zahodnih tehnoloških podjetij upadle za 5 do 30 odstotkov.[6]

Tehnologija

[uredi | uredi kodo]

20. januarja 2025[7] je DeepSeek predstavil veliki jezikovni model DeepSeek-R1, ki temelji na tehnologijah strojnega učenja in uporablja arhitekturo, primerljivo z obstoječimi transformerskimi modeli.

DeepSeek-R1 je bil objavljen pod licenco MIT, ki dovoljuje tako komercialno kot akademsko uporabo brez omejitev. S tem se podjetje razlikuje od številnih lastniških sistemov umetne inteligence, ki so omejeni z restriktivnimi licencami. Dostop je mogoč prek več načinov: aplikacije, spletnega vmesnika in programskega vmesnika (API).

Zunanje povezave

[uredi | uredi kodo]

Sklici

[uredi | uredi kodo]
  1. Billions Going to China’s Quants Takes Fight to Global Funds. Bloomberg, 31. maj 2020.
  2. »How small Chinese AI start-up DeepSeek shocked Silicon Valley«. financial.times (v angleščini). Pridobljeno 29. januarja 2025.
  3. Lily Ottinger: Deepseek: From Hedge Fund to Frontier Model Maker. V: chinatalk.media, 9. december 2024.
  4. »Interview with Deepseek Founder: We're Done Following. It's Time to Lead«. The China Academy (v ameriški angleščini). 26. januar 2025. Pridobljeno 29. januarja 2025.
  5. »Warum DeepSeek die KI-Welt schockt – DW – 28.01.2025« (v nemščini). Pridobljeno 28. januarja 2025.
  6. »Chiphersteller, Energie, Dollar: Warum der Deepseek-Schock sogar Kernkraftwerke erfasst«. n-tv.de. 28. januar 2025. Pridobljeno 29. januarja 2025.
  7. »DeepSeek-R1 Release | DeepSeek API Docs« (v angleščini). Pridobljeno 28. januarja 2025.