Generative pre-trained transformer

Un generative pre-trained transformer (o GPT, in italiano trasformatore generativo pre-addestrato) è un tipo di modello linguistico di grandi dimensioni (LLM)[1][2][3] e un importante framework per l’intelligenza artificiale generativa.[4][5] Si tratta di una rete neurale artificiale usata per l’elaborazione del linguaggio naturale da parte delle macchine.[6] È basata sull’architettura transformer del deep learning, pre-addestrata su grandi dataset di testi non etichettati e in grado di generare nuovi contenuti simili a quelli umani.[2][3] A partire dal 2023, la maggior parte dei LLM presentava queste caratteristiche[7] ed erano talvolta definiti in modo generico come GPT.[8]
Il primo GPT è stato introdotto nel 2018 da OpenAI.[9] OpenAI ha rilasciato importanti modelli fondamentali GPT numerati in sequenza, a formare la serie "GPT-n".[10] Ognuno di questi era significativamente più potente del precedente, grazie all’aumento delle dimensioni (numero di parametri addestrabili) e dell’addestramento. Il più recente, GPT-4o, è stato rilasciato nel maggio 2024.[11] Tali modelli hanno costituito la base per sistemi GPT specializzati, inclusi modelli ottimizzati per seguire istruzioni, che a loro volta alimentano ChatGPT.[1]
Il termine "GPT" è utilizzato anche nei nomi e nelle descrizioni di modelli sviluppati da altri. Ad esempio, altri modelli fondamentali GPT includono una serie di modelli creati da EleutherAI,[12] e sette modelli creati da Cerebras nel 2023.[13] Aziende in vari settori hanno sviluppato GPT specializzati per compiti specifici nei rispettivi ambiti, come "EinsteinGPT" di Salesforce (per la CRM)[14] e "BloombergGPT" di Bloomberg (per la finanza).[15]
Note
[modifica | modifica wikitesto]- ^ a b (EN) Mohammed Haddad, How does GPT-4 work and how can you start using it in ChatGPT?, su www.aljazeera.com. URL consultato il 10 aprile 2023 (archiviato il 5 luglio 2023).
- ^ a b (EN) Generative AI: a game-changer society needs to be ready for, su World Economic Forum, 9 gennaio 2023. URL consultato l'8 aprile 2023 (archiviato il 25 aprile 2023).
- ^ a b (EN) The A to Z of Artificial Intelligence, su time.com, Time, 13 aprile 2023. URL consultato il 14 aprile 2023 (archiviato il 16 giugno 2023).
- ^ (EN) Luhui Hu, Generative AI and Future, su Medium, 15 novembre 2022. URL consultato il 29 aprile 2023 (archiviato il 5 giugno 2023).
- ^ (EN) CSDL | IEEE Computer Society, su www.computer.org. URL consultato il 29 aprile 2023 (archiviato il 28 aprile 2023).
- ^ (EN) LibGuides: Using AI Language Models : ChatGPT, su hallmark.libguides.com. URL consultato il 7 dicembre 2023 (archiviato l'8 dicembre 2023).
- ^ (EN) Rob Toews, The Next Generation Of Large Language Models, su Forbes. URL consultato il 9 aprile 2023 (archiviato il 14 aprile 2023).
- ^ (EN) Joe Mckendrick, Most Jobs Soon To Be 'Influenced' By Artificial Intelligence, Research Out Of OpenAI And University Of Pennsylvania Suggests, su forbes.com, Forbes, 13 marzo 2023. URL consultato il 16 aprile 2023 (archiviato il 16 aprile 2023).
- ^ (EN) Alec Radford, Karthik Narasimhan, Tim Salimans e Ilya Sutskever, Improving Language Understanding by Generative Pre-Training (PDF), su cdn.openai.com, OpenAI, 11 giugno 2018, p. 12. URL consultato il 23 gennaio 2021 (archiviato il 26 gennaio 2021).
- ^ Template:Cita webfirst
- ^ (EN) GPT-4, su openai.com. URL consultato l'8 dicembre 2023 (archiviato il 14 marzo 2023).
- ^ Anthony Alford, EleutherAI Open-Sources Six Billion Parameter GPT-3 Clone GPT-J, su InfoQ, 13 luglio 2021. URL consultato il 3 aprile 2023 (archiviato il 10 febbraio 2023).
- ^ News, su businesswire.com. URL consultato il 5 aprile 2023 (archiviato il 5 aprile 2023).
- ^ Ryan Morrison, Salesforce launches EinsteinGPT built with OpenAI technology, su Tech Monitor, 7 marzo 2023. URL consultato il 10 aprile 2023 (archiviato il 15 aprile 2023).
- ^ The ChatGPT of Finance is Here, Bloomberg is Combining AI and Fintech, su Forbes. URL consultato il 6 aprile 2023 (archiviato il 6 aprile 2023).