{"id":21698,"date":"2024-10-22T13:33:02","date_gmt":"2024-10-22T11:33:02","guid":{"rendered":"https:\/\/dhd-blog.org\/?p=21698"},"modified":"2024-10-22T13:33:02","modified_gmt":"2024-10-22T11:33:02","slug":"virtuelles-dh-kolloquium-an-der-bbaw-28-10-2024-fragen-sie-ihre-daten-perspektiven-fuer-den-einsatz-von-retrieval-augmented-generation-in-den-dh","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=21698","title":{"rendered":"Virtuelles DH-Kolloquium an der BBAW, 28.10.2024: \u201efRAGen Sie Ihre Daten &#8211; Perspektiven f\u00fcr den Einsatz von Retrieval Augmented Generation in den DH\u201c"},"content":{"rendered":"\n<p>Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum n\u00e4chsten Termin am Montag, den 28. Oktober 2024, 16 Uhr c.t., ein (virtueller Raum: https:\/\/meet.gwdg.de\/b\/lou-eyn-nm6-t6b):<\/p>\n\n\n\n<p><strong>Timm Lehmberg (Akademie der Wissenschaften in Hamburg)<\/strong><br>\u00fcber<br><strong>fRAGen Sie Ihre Daten &#8211; Perspektiven f\u00fcr den Einsatz von Retrieval Augmented Generation in den DH<\/strong><\/p>\n\n\n\n<p style=\"text-align: center\">***<\/p>\n\n\n\n<p>Der Beitrag f\u00fchrt in die Methoden der Retrieval Augmented Generation (RAG) ein, einem mittlerweile auch in den Digital Humanities verbreiteten Verfahren, das es erm\u00f6glicht, auf eigene Datenquellen mithilfe gro\u00dfer Sprachmodelle (Large Language Models, LLMs)\u00a0 zuzugreifen.\u00a0Ziel der Mehrzahl der Anwendungsf\u00e4lle ist dabei zumeist, fachspezifische Abfragen und Analysen (nicht selten unter Verwendung eingeschr\u00e4nkt zug\u00e4nglicher lokaler Datenbest\u00e4nde) per Chat Prompting durchzuf\u00fchren.\u00a0\u00a0<\/p>\n<p>Da bereits eine beachtliche Zahl bedienungsfreundlicher Frameworks und gut dokumentierte Workflows den Einstieg out-of-the-box erleichtern, ist das blo\u00dfe Generieren solcher Abfragen keine sehr gro\u00dfe Herausforderung mehr. Die Skalierung und Anpassung und letztendliche Nutzung im Rahmen des wissenschaftlichen Arbeitens hingegen erfordert h\u00e4ufig ein umfassendes Anpassen der einzelnen Schritte und Komponenten.\u00a0<\/p>\n<p>Anhand einiger Anwendungsbeispiele wird daher das Verfahren zun\u00e4chst zu Methoden wie dem Fine-Tuning von LLMs und dem Prompt Engineering abgegrenzt werden. Darauf aufbauend werden die einzelnen Verarbeitungsschritte (Vorverarbeitung der Daten, Chunking, Skalierung des verwendeten Chat Modells etc.) und deren Auswirkungen auf das Retrievalergebnis anschaulich vorgestellt.\u00a0\u00a0<\/p>\n\n\n\n<p style=\"text-align: center\"><strong>***<\/strong><\/p>\n\n\n\n<p>Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum \u00fcber den Link <a href=\"https:\/\/meet.gwdg.de\/b\/lou-eyn-nm6-t6b\">https:\/\/meet.gwdg.de\/b\/lou-eyn-nm6-t6b<\/a>\u00a0erreichbar. Wir m\u00f6chten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion k\u00f6nnen Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.<\/p>\n\n\n\n<p>Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der <a href=\"https:\/\/www.bbaw.de\/bbaw-digital\/dh-kolloquium\">Website der BBAW<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum n\u00e4chsten Termin am Montag, den 28. Oktober 2024, 16 Uhr c.t., ein (virtueller Raum: https:\/\/meet.gwdg.de\/b\/lou-eyn-nm6-t6b): Timm Lehmberg (Akademie der Wissenschaften in Hamburg)\u00fcberfRAGen Sie Ihre Daten &#8211; Perspektiven f\u00fcr den Einsatz von Retrieval Augmented Generation in den DH *** Der Beitrag f\u00fchrt in die [&hellip;]<\/p>\n","protected":false},"author":311,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,103,11,161,1194,657],"tags":[759,49,736,1424],"class_list":["post-21698","post","type-post","status-publish","format-standard","hentry","category-allgemein","category-community","category-forschung","category-kolloquium","category-tool-service","category-vortrag","tag-bbaw","tag-berlin","tag-dh-kolloquium","tag-text-2"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/21698","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/311"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=21698"}],"version-history":[{"count":4,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/21698\/revisions"}],"predecessor-version":[{"id":21786,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/21698\/revisions\/21786"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=21698"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=21698"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=21698"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}