Régie et délégation de compétences
Nous mettons à disposition des SRE / Platform Engineers, de profils juniors à expérimentés, pour fiabiliser vos plateformes, automatiser vos opérations et améliorer l’expérience de vos équipes produit. Ils conçoivent et opèrent des environnements Kubernetes à l’échelle, définissent des SLO/SLI pertinents et mettent en place une observabilité actionnable. Objectif : plus de disponibilité, moins d’incidents, des déploiements prévisibles.
Rôle & missions
Le SRE / Platform Engineer conçoit la plateforme d’exécution, outille l’observabilité et industrialise le run pour accélérer les équipes applicatives. Les missions principales sont les suivantes :
- Bâtir et opérer des clusters Kubernetes (EKS/AKS/GKE/on-prem), gestion réseau/ingress/SSL/tâches
- Définir des SLO/SLI, mettre en place l’alerting significatif et réduire le toil par l’automatisation
- Implémenter GitOps (Argo CD), CI/CD, Infrastructure as Code (Terraform), secrets et politiques
- Renforcer sécurité (RBAC, PSP/Pod Security, policies OPA, scans images/dépendances), gestion des accès
- Piloter la réponse à incident (post-mortems, remédiations), capacity planning et optimisation coûts
Compétences clés
Nos profils s’appuient sur des standards ouverts et un outillage moderne pour atteindre la fiabilité attendue tout en améliorant le developer experience. Les compétences à mobiliser comprennent :
- Conteneurs & orchestration : Kubernetes, Helm/Kustomize, CNI/Ingress, autoscaling (HPA/VPA), jobs/cron
- Observabilité : Prometheus/Alertmanager, Grafana, Loki/ELK, OpenTelemetry (logs/métriques/traces), SLO/SLI
- CI/CD & GitOps : GitLab CI/GitHub Actions/Jenkins, Argo CD, stratégies blue/green/canary, rollback
- IaC & configuration : Terraform (AWS/Azure/GCP), Ansible, policy as code (OPA/Gatekeeper), gestion des secrets (Vault/Sealed Secrets)
- Sécurité & résilience : RBAC fin, network policies, image hardening, scans SAST/DAST/Dependency, chaos engineering de base
- Plateforme & runtimes : Nginx/Envoy/Ingress, service mesh (Istio/Linkerd selon contexte), stockage persistant (CSI), cache (Redis)
Formations & expériences
Profils issus de Bac+3 à Bac+5 ou équivalent par l’expérience, à l’aise avec l’agilité (Scrum/Kanban) et les pratiques SRE (post-mortems sans blâme, indicateurs DORA). Habitués à travailler en platform team au service des squads produit, ils savent arbitrer entre fiabilité, vitesse et coût.
Valeurs Jehann
Nous proposons un cadre simple, réactif et sécurisant pour vos plateformes : objectifs clairs, SLO partagés et amélioration continue mesurable. Nos garanties incluent :
- Shortlist en 72 h et démarrage sous 5–10 jours
- TJM transparent, points d’avancement et indicateurs qualité mensuels
- Remplacement garanti en cas d’imprévu
Exemples de livrables
Chaque intervention est orientée résultat, documentée et opérationnelle. Exemples :
- Cluster Kubernetes prêt à l’emploi (Helm/Argo CD), GitOps, ingress, certificats et autoscaling
- Pile d’observabilité : Prometheus/Alertmanager, Grafana, logs (Loki/ELK), traces (OpenTelemetry), SLO & alertes
- Chaîne CI/CD à l’échelle (lint/tests/build/scan/deploy) avec déploiements blue/green/canary
- Terraform pour réseaux/identités/stockages, politiques de sécurité (OPA) et gestion des secrets
- Playbooks d’incident, post-mortems et tableau de bord de fiabilité (erreur budget, MTTR/MTBF)