Performance

La vitesse transforme le produit.

Quand l'intelligence s'exécute assez vite, les utilisateurs cessent d'attendre les réponses et commencent à travailler avec une cognition en temps réel.

1000ms

Jusqu'à la nanoseconde.
Par conception.

Certaines charges de travail du runtime s'exécutent en nanosecondes dans des conditions mesurées.

Méthodologie

Un benchmark doit expliquer ce qu'il mesure.

Les revendications de performance n'ont aucun sens sans définition des charges de travail, contexte matériel, état à chaud/à froid, taille des charges utiles, concurrence et vérifications de justesse. Les pages Thyn emploient une formulation prudente : certaines charges de travail du runtime, et non des flux produit entiers.

Microbenchmarks

Mesurent les primitives serrées du runtime : recherches en cache, vérifications de règles, ordonnancement, sérialisation et chemins d'exécution locaux.

Benchmarks de pipeline

Mesurent les boucles complètes : récupération du contexte, exécution du modèle, invocation d'outils, vérification et assemblage de la réponse.

Benchmarks produit

Mesurent des tâches utilisateur réalistes face aux démarrages à froid, aux pannes réseau, à la variabilité des modèles et aux formes des données client.

Ce que nous optimisons.

Métrique

Dimension de performance

Pourquoi c'est important
Approche d'ingénierie
Latence p50 / p95

Temps de réponse médian et de queue.

Les utilisateurs ressentent la latence de queue comme un flux rompu.

Ordonnancement, chemins à chaud, exécution locale et dépendances bornées.

Temps jusqu'à la décision

Durée de la boucle signal-action.

Le trading, les agents et les systèmes de croissance dépendent du moment de la décision.

Contexte précalculé, règles rapides et sauts réseau minimaux.

Justesse sous contrainte de vitesse

Qualité maintenue pendant la réduction de la latence.

Des systèmes rapides mais erronés ne sont pas des systèmes intelligents.

Évaluations, rejeu, vérifications d'invariants et garde-fous de rollback.

La vitesse débloque de nouvelles interfaces.

Copilotes en temps réel

Un raisonnement qui se met à jour pendant que l'utilisateur saisit, glisse, fixe des prix, route, édite ou teste — suggestions, contrôles et aperçus arrivent dans la même image, et non après un spinner.

Interaction

Simulations continues

Les agents et les systèmes de trading testent des possibilités en arrière-plan avant de s'engager. Des milliers de scénarios s'exécutent entre deux frappes, si bien que le système explore les résultats plus vite qu'une personne ne peut les demander.

Planification

Contexte privé

Davantage de décisions peuvent exploiter des données sensibles sans appel API distant à chaque étape. L'exécution locale garde le contexte propriétaire sur l'appareil, pour que vitesse et confidentialité cessent de s'opposer.

Confidentialité

Rapprochez l'intelligence.