Digital Podcast   /     KI-Benchmarks haben mehr Probleme als Lösungen

Description

KI-Entwickler brĂŒsten sich stolz mit den Zahlen, die ihre Systeme in Benchmark-Tests erreichen. Wir erklĂ€ren, wie KI-Benchmarks funktionieren und fragen: Wie aussagekrĂ€ftig sind solche Tests wirklich? Und kommt es am Ende vielleicht bloss auf die «Vibes» an? Der ganze Podcast im Überblick: (00:01:28) Was sind eigentlich KI-Benchmark-Tests? (00:06:23) Neun Probleme (00:34:27) Drei Lösungen Chatbot Arena: https://chat.lmsys.org SRF Geek Sofa bei Discord: https://discord.gg/geeksofa

Subtitle
KI-Entwickler brĂŒsten sich stolz mit den Zahlen, die ihre Systeme in Benchmark-Tests erreichen. Wir erklĂ€ren, wie KI-Benchmarks funktionieren und fragen: Wie aussagekrĂ€ftig sind solche Tests wirklich? Und kommt es am Ende vielleicht bloss auf die «V
Duration
2829
Publishing date
2024-04-05 14:00
Contributors
  Schweizer Radio und Fernsehen (SRF)
author  
Enclosures
https://download-media.srf.ch/world/audio/Digital-Podcast-radio/2024/04/Digital-Podcast-radio-aa20ce3a-7fc4-4291-9f53-11ff70b18a64-1.mp3?d=ap&assetId=aa20ce3a-7fc4-4291-9f53-11ff70b18a64
audio/mpeg