LCC 243 - Interview SRE avec Nicolas Helleringer et Maxime Brugidou - partie 1

Published: Dec. 4, 2020, 8:48 a.m.

Nicolas et Maxime de Crit\xe9o partagent avec Emmanuel leur exp\xe9rience de mise en place d\u2019une organisation SRE (Site Reliability Engineering).

Enregistr\xe9 le 12 novembre 2020

T\xe9l\xe9chargement de l\u2019\xe9pisode LesCastCodeurs-Episode\u2013243.mp3

Interview Ta vie, ton oeuvre

Twotter Nicolas
Twitter Maxime
Criteo Labs

SRE en 2 phrases

Site Reliability Engineering C\u2019est une fa\xe7on de monter un salaire de sysadmin ?

Pourquoi

Ops et dev, pourquoi \u201cmerger\u201d ?
DevOps avec un sysadmin dans l\u2019\xe9quipe vs SRE
Cela a du sens de le faire sur un \u201cpetit projet\u201d ou uniquement si on g\xe8re 300k machines ?

SRE au quotidien

Journ\xe9e type

Dashboard

On code en quoi?

Pager (pendant les horaires travails vs dehors)
Les weekends

Taille SRE pour pour du 24/7

Combien de fois est-on appel\xe9 par nuit ? Prod fallback

Le development

Livre: le projet Unicorn

Concepts int\xe9ressants

50% eng

SLO SLI SLA
La difficult\xe9 de la valeur initiale
Perf pass\xe9es vs calcul th\xe9orique

Error budget
Blast radius
Burn rate

Pr\xe9 conclusion

C\u2019est la fin de la partie 1 de cette interview

Nous contacter

Faire un crowdcast ou une crowdquestion
Contactez-nous via twitter https://twitter.com/lescastcodeurs
sur le groupe Google https://groups.google.com/group/lescastcodeurs
ou sur le site web https://lescastcodeurs.com/
Flattr-ez nous (dons) sur https://lescastcodeurs.com/
En savoir plus sur le sponsoring? sponsors@lescastcodeurs.com