Diese LLMs können z.B. auch mit Code, Bildern, Videos usw. umgehen und wurden auch damit trainiert. Der einzige unterschied zu LLMs besteht darin dass die Token anders gebildet werden. Sobald die Tokens erzeugt sind ist die Funktionsweise wieder gleich.