LLMs and Alignment

Marraskuusta 2024 lähtien AaltoAI ja Tutke ovat järjestäneet yhdessä viikoittaista lukupiiriä, jossa seurataan suurten kielimallien kehitystä käymällä syventäviä keskusteluja viimeisimmistä tutkimusartikkeleista.

Kymmenien tapaamisten aikana olemme käyneet läpi modernin tekoälyn perusteita, kuten sanaupotuksia (word embeddings), transformer-malleja ja skaalautumislakeja, sekä avoimia ongelmia tekoälyn linjaamisessa (alignment), harhaanjohtavassa käytöksessä, tekoälyhallinnossa ja mekanistisessa tulkittavuudessa. Olemme myös pitäneet esitelmiä viimeisimmästä tutkimuksesta, järjestäneet yhteisiä koodaussprinttejä ja katsoneet elokuvia, joissa pohditaan älykkyyden merkitystä.

Tekoälyjärjestelmistä tulee yhä autonomisempia, ja ne alkavat tehdä todelliseen maailmaan vaikuttavia päätöksiä. Tämän vuoksi niiden linjaaminen ihmisten arvojen mukaisiksi on tärkeämpää kuin koskaan. Viikoittaisten tapaamistemme tavoitteena on pysyä mukana sekä turvallisuustutkimuksen että tekoälyn kyvykkyyksien edistysaskelten tahdissa.

Tule mukaan keskustelemaan uudesta tutkimuksesta, jakamaan ideoita ja pysymään ajan tasalla tekoälyn nopeasti kehittyvässä maailmassa.

Kalenteri on toistaiseksi vain englanniksi