feat: expose language detection probabilities to server example #3044

sachaarbonel · 2025-04-14T08:21:13Z

Description:
This PR enhances the JSON API response by adding detailed language detection information when transcribing or translating audio. The changes include:

Language detection probabilities for the detected language
A comprehensive list of language probabilities for all languages with non-negligible confidence scores (>0.001)
Integration with Whisper's existing language detection capabilities

The new information is added under a language_detection field in the JSON response, containing:

probability: Confidence score for the detected language
language_probabilities: Map of language codes to their detection probabilities

This enhancement provides more transparency into the language detection process and can be valuable for applications requiring confidence scores in language identification.

The changes are non-breaking and only add additional information to the existing JSON response structure.

Example Output:

{
  "task": "transcribe",
  "language": "english",
  "text": "This is the transcribed text of the audio file.",
  "language_detection": {
    "probability": 0.982,
    "language_probabilities": {
      "en": 0.982,
      "fr": 0.008,
      "es": 0.005,
      "de": 0.003
    }
  },
  "segments": [
    // ... segments array content ...
  ]
}

In this example:

The main detected language (English) has a 98.2% confidence score
Other languages with lower probabilities are also included
Only languages with probabilities > 0.001 (0.1%) are shown
The original JSON structure remains intact, with the new language_detection field added

examples/server/server.cpp

sachaarbonel · 2025-04-28T10:40:45Z

@danbev I addressed the code review comments, can you review again please

feat: expose language detection probabilities to server.cpp

6f5c781

sachaarbonel changed the title ~~feat: expose language detection probabilities to server.cpp~~ feat: expose language detection probabilities to server example Apr 14, 2025

danbev approved these changes Apr 16, 2025

View reviewed changes

examples/server/server.cpp Outdated Show resolved Hide resolved

examples/server/server.cpp Outdated Show resolved Hide resolved

examples/server/server.cpp Outdated Show resolved Hide resolved

examples/server/server.cpp Outdated Show resolved Hide resolved

sachaarbonel added 2 commits April 28, 2025 12:35

feat: enhance language detection output in server.cpp

46021af

Remove empty spaces.

c59b8b5

danbev merged commit f0171f0 into ggml-org:master Apr 28, 2025
51 of 52 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feat: expose language detection probabilities to server example #3044

feat: expose language detection probabilities to server example #3044

sachaarbonel commented Apr 14, 2025

sachaarbonel commented Apr 28, 2025

feat: expose language detection probabilities to server example #3044

feat: expose language detection probabilities to server example #3044

Conversation

sachaarbonel commented Apr 14, 2025

sachaarbonel commented Apr 28, 2025