ai_sandbox/speech-speech/backend/api.py

from openai import OpenAI
from fastapi import FastAPI, File, Response, Request
from fastapi.middleware.cors import CORSMiddleware
from fastapi.responses import FileResponse
from pydantic import BaseModel
from io import BytesIO


app = FastAPI()
openAI_clinet = OpenAI()

app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],
    allow_methods=["*"],
    allow_headers=["*"],
)


class ConversationMessege(BaseModel):
    role: str
    content: str


class Conversation(BaseModel):
    messages: list[ConversationMessege]


@app.post("/get-text")
async def stt(audio: bytes = File()):
    with BytesIO(audio) as f:
        f.name = "audio.mp3"
        transcript = openAI_clinet.audio.transcriptions.create(
            model="whisper-1",
            file=f,
            response_format="text",
        )
    data = {"len": len(audio), "user-transcript": transcript}
    return data


@app.post("/conversation")
async def get_next_response(request: Request):
    messages = await request.json()
    res = openAI_clinet.chat.completions.create(
        model="gpt-3.5-turbo",
        messages=messages,
    )
    res_msg = res.choices[0].message.content
    role = res.choices[0].message.role
    print(messages)
    print(res_msg)
    return {"role": role, "content": res_msg}


@app.get("/speak")
def tts(text: str):
    res = openAI_clinet.audio.speech.create(
        model="tts-1", voice="nova", input=text, response_format="mp3"
    )
    return Response(content=res.content, media_type="audio/mp3")
backend to interface with ai models 2024-02-20 11:31:01 -05:00			`from openai import OpenAI`
			`from fastapi import FastAPI, File, Response, Request`
cors 2024-02-24 17:58:26 -05:00			`from fastapi.middleware.cors import CORSMiddleware`
tts backend 2024-02-20 19:35:36 -05:00			`from fastapi.responses import FileResponse`
backend to interface with ai models 2024-02-20 11:31:01 -05:00			`from pydantic import BaseModel`
cleaning up backend sins now 2024-02-26 11:52:13 -05:00			`from io import BytesIO`
backend to interface with ai models 2024-02-20 11:31:01 -05:00

			`app = FastAPI()`
			`openAI_clinet = OpenAI()`

cors 2024-02-24 17:58:26 -05:00			`app.add_middleware(`
			`CORSMiddleware,`
			`allow_origins=["*"],`
			`allow_methods=["*"],`
			`allow_headers=["*"],`
			`)`

backend to interface with ai models 2024-02-20 11:31:01 -05:00
			`class ConversationMessege(BaseModel):`
			`role: str`
			`content: str`


			`class Conversation(BaseModel):`
			`messages: list[ConversationMessege]`


			`@app.post("/get-text")`
cleaning up backend sins now 2024-02-26 11:52:13 -05:00			`async def stt(audio: bytes = File()):`
			`with BytesIO(audio) as f:`
			`f.name = "audio.mp3"`
file response streamlining 2024-02-25 17:09:35 -05:00			`transcript = openAI_clinet.audio.transcriptions.create(`
			`model="whisper-1",`
			`file=f,`
			`response_format="text",`
cleaning up backend sins now 2024-02-26 11:52:13 -05:00			`)`
file response streamlining 2024-02-25 17:09:35 -05:00			`data = {"len": len(audio), "user-transcript": transcript}`
backend to interface with ai models 2024-02-20 11:31:01 -05:00			`return data`


			`@app.post("/conversation")`
playing back response 2024-02-25 13:40:08 -05:00			`async def get_next_response(request: Request):`
backend to interface with ai models 2024-02-20 11:31:01 -05:00			`messages = await request.json()`
			`res = openAI_clinet.chat.completions.create(`
			`model="gpt-3.5-turbo",`
			`messages=messages,`
			`)`
			`res_msg = res.choices[0].message.content`
			`role = res.choices[0].message.role`
chat history 2024-02-20 17:29:37 -05:00			`print(messages)`
backend to interface with ai models 2024-02-20 11:31:01 -05:00			`print(res_msg)`
			`return {"role": role, "content": res_msg}`
tts backend 2024-02-20 19:35:36 -05:00

file response streamlining 2024-02-25 17:09:35 -05:00			`@app.get("/speak")`
playing back response 2024-02-25 13:40:08 -05:00			`def tts(text: str):`
tts backend 2024-02-20 19:35:36 -05:00			`res = openAI_clinet.audio.speech.create(`
cleaning up backend sins now 2024-02-26 11:52:13 -05:00			`model="tts-1", voice="nova", input=text, response_format="mp3"`
tts backend 2024-02-20 19:35:36 -05:00			`)`
file response streamlining 2024-02-25 17:09:35 -05:00			`return Response(content=res.content, media_type="audio/mp3")`