7,540
edits
Changes
→Counter
builder_builds_failed_total{reason="build_canceled"} 0
</pre>
A counter típusú metrikák neve a konvenció szerint '''_total''' postfix-el van ellátva.
A számláló abszolút értékére nem szokás támaszkodni, mivel a service újraindulásakor a számlálón nullázódik, folyton jú nodo-okat indítunk el, vagy régieket állítunk le, a service-ek jönnek, mennek. Sokkal inkább az időbeli változása a lényeg, tehát olyan lekérdezéseket (gráfokat) praktikus felírni, ami csak egy adott időszeletre vonatkozik, pl mindig csak az utolsó 5 percre. Lássunk két példát:
Az alábbi '''sum(<metrika név>)''' függvény az összes olyan utoljára már begyűjtött metrikának összegzi az értékét ahol a metrika neve és a címke az alábbi volt: ''batch_jobs_completed_total{job_type="hourly-cleanup"}''. Azonban ha újra indul újraindul egy node, akkor a node-hoz tartozó batch_jobs_completed_total nevű számláló típusú metrika értéke nulláról fog újra indulni, így hamis képet láthatunk.
sum(batch_jobs_completed_total{job_type="hourly-cleanup"})