In einem anderen Kanal habe ich heute morgen noch beschrieben, wie m.E. der Umgang mit LLMs heuer deutlich pragmatischer als letztes Jahr ist: Weniger Begeisterung für sensationelle neue Leistungsfähigkeit als Vergleich mit anderen (ML) Verfahren, Integration in nachhaltige Infrastrukturangebote, Reproduzierbarkeit und offene Modelle, Qualität und Schwierigkeit in konkreten Projekt-Einsätzen (OCR, Informationsextraktion, Bildbeschreibung, ...).
Aber "pragmatisch" ist wohl nicht gleich "kritisch", denn prompt gibt es eine Projektvorstellung die dann doch wieder nur möglichst große und vermeintlich leistungsfähige LLMs heranzieht, nur relative grobe, globale Evaluation betreibt (Inter-Annotator Agreement statt Precision/Recall) und keinen Vergleich mit alternativen technischen (NLP-)Methoden unternimmt.
Immerhin ist eine Frage in der Diskusson: Willst Du versuchen, künftig noch modernere, größere Modelle oder vielleicht kleinere, spezialisierte Modelle zu verwenden?