L'image (de la pochette) est traitée comme un flux vidéo par ffmpeg. Pour la supprimer, on utilise l'option -vn ou -map.
Sans réencoder :
L'audio est copiée plutôt que d'être réencodée :
ffmpeg -i fichierIN -vn -codec:a copy -map_metadata -1 fichierOUT
Idem, mais avec -map au lieu de -vn
ffmpeg -i fichierIN -map 0:a -codec:a copy -map_metadata -1 fichierOUT
-map pour choisir le flux. -map 0:a selectionne le flux audio n°0 (unique flux, dans notre cas).
-map est beaucoup plus flexible.