Pildist tekstiks tehisintellekti mudelid: CLIP, BLIP, WD 1.4 (ehk WD14), SigLIP 2 ja ChatGPT Visioniga

Piltide automaatne märgendamine, sildistamine või kirjeldamine on paljudes rakendustes, eriti masinõppe andmekogumite ettevalmistamisel, ülioluline ülesanne. Siin tulevad appi pildist tekstiks mudelid. Peamiste pildist tekstiks mudelite hulka kuuluvad CLIP, BLIP, WD 1.4 (tuntud ka kui WD14…

GPT-4 mudelid, mis õpivad oma vigadest: läbimurre tehisintellekti arutlusvõimes

Tehisintellekti maailm areneb pidevalt ja hiljutine läbimurre tehisintellekti uuringutes on viinud asjad täiesti uuele tasemele. Uues teadusartiklis tutvustatakse “Refleksiooni” (Reflection), autonoomset agenti dünaamilise mälu ja eneserefleksiooni võimetega, mis võimaldab tehisintellekti mudelitel õppida oma vigadest ja…