Add Kubernetes support (#18)

2023-08-18 10:48:24 -06:00 · 2023-08-18 10:48:24 -06:00 · ca6ec9b370
parent bd50076aae
commit ca6ec9b370
5 changed files with 106 additions and 0 deletions
--- a/deploy/kubernetes/kustomization.yaml
+++ b/deploy/kubernetes/kustomization.yaml
@ -0,0 +1,20 @@
+apiVersion: kustomize.config.k8s.io/v1beta1
+kind: Kustomization
+
+resources:
+- llama-gpt-api-deployment.yaml
+- llama-gpt-api-service.yaml
+- llama-gpt-ui-deployment.yaml
+- llama-gpt-ui-service.yaml
+
+# patches:
+# - 
+
+configMapGenerator:
+- name: llama-gpt
+  literals:
+  - DEFAULT_MODEL="/models/llama-2-7b-chat.bin"
+  - OPENAI_API_HOST="http://llama-gpt-api:8000"
+  - OPENAI_API_KEY="sk-XXXXXXXXXXXXXXXXXXXX"
+  - WAIT_HOSTS="llama-gpt-api:8000"
+  - WAIT_TIMEOUT="600"
--- a/deploy/kubernetes/llama-gpt-api-deployment.yaml
+++ b/deploy/kubernetes/llama-gpt-api-deployment.yaml
@ -0,0 +1,29 @@
+apiVersion: apps/v1
+kind: Deployment
+metadata:
+  labels:
+    service: llama-gpt-api
+  name: llama-gpt-api
+spec:
+  replicas: 1
+  selector:
+    matchLabels:
+      service: llama-gpt-api
+  template:
+    metadata:
+      labels:
+        service: llama-gpt-api
+    spec:
+      containers:
+        - name: llama-gpt-api
+          image: ghcr.io/getumbrel/llama-gpt-api:1.0.1
+          env:
+            - name: MODEL
+              valueFrom: 
+                configMapKeyRef:
+                  name: llama-gpt
+                  key: DEFAULT_MODEL
+          resources:
+            requests:
+              memory: 5Gi
+      restartPolicy: Always
--- a/deploy/kubernetes/llama-gpt-api-service.yaml
+++ b/deploy/kubernetes/llama-gpt-api-service.yaml
@ -0,0 +1,15 @@
+apiVersion: v1
+kind: Service
+metadata:
+  labels:
+    service: llama-gpt-api
+  name: llama-gpt-api
+spec:
+  ports:
+    - name: api
+      port: 8000
+      targetPort: 8000
+  selector:
+    service: llama-gpt-api
+status:
+  loadBalancer: {}
--- a/deploy/kubernetes/llama-gpt-ui-deployment.yaml
+++ b/deploy/kubernetes/llama-gpt-ui-deployment.yaml
@ -0,0 +1,26 @@
+apiVersion: apps/v1
+kind: Deployment
+metadata:
+  labels:
+    service: llama-gpt-ui
+  name: llama-gpt-ui
+spec:
+  replicas: 1
+  selector:
+    matchLabels:
+      service: llama-gpt-ui
+  template:
+    metadata:
+      labels:
+        service: llama-gpt-ui
+    spec:
+      containers:
+        - name: llama-gpt-ui
+          image: ghcr.io/getumbrel/llama-gpt-ui:latest
+          envFrom:
+          - configMapRef:
+              name: llama-gpt
+          ports:
+            - containerPort: 3000
+          resources: {}
+      restartPolicy: Always
--- a/deploy/kubernetes/llama-gpt-ui-service.yaml
+++ b/deploy/kubernetes/llama-gpt-ui-service.yaml
@ -0,0 +1,16 @@
+apiVersion: v1
+kind: Service
+metadata:
+  labels:
+    service: llama-gpt-ui
+  name: llama-gpt-ui
+spec:
+  ports:
+    - name: ui
+      port: 3000
+      targetPort: 3000
+  selector:
+    service: llama-gpt-ui
+  type: ClusterIP
+status:
+  loadBalancer: {}