详解 php 流式调用 OpenAI 的 gpt-3.5-turbo 模型接口,实时接收回答并实时传送给前端打字机显示
2023年11月26日
197
详解 php 流式调用 OpenAI 的 gpt-3.5-turbo 模型接口,实时接收回答并实时传送给前端打字机显示

原理阐明

流式接纳 OpenAI 的回来数据

后端 Class.ChatGPT.php 顶用 curl 向 OpenAI 建议恳求,运用 curl 的 CURLOPT_WRITEFUNCTION 设置回调函数,一起恳求参数里 'stream' => true 告知 OpenAI 敞开流式传输。

咱们经过 curl_setopt($ch, CURLOPT_WRITEFUNCTION, [$this->streamHandler, 'callback']); 设置运用 StreamHandler 类的实例化对象 $this->streamHandler 的 callback 方法来处理 OpenAI 回来的数据。

OpenAI 会在模型每次输出时回来 data: {"id":"","object":"","created":1679616251,"model":"","choices":[{"delta":{"content":""},"index":0,"finish_reason":null}]} 格式字符串,其中咱们需求的答复就在 choices[0]['delta']['content'] 里,当然咱们也要做好异常判别,不能直接这样获取数据。

另外,实际由于网络传输问题,每次 callback 函数收到的数据并不一定只要一条 data: {"key":"value"} 格式的数据,有或许只要半条,也有或许有多条,还有或许有N条半。

所以咱们在 StreamHandler 类中增加了 data_buffer 属性来存储无法解析的半条数据。

这儿依据 OpenAI 的回来数据格式,做了一些特别处理,详细代码如下:

public function callback($ch, $data) {
        $this->counter += 1;
        file_put_contents('./log/data.'.$this->qmd5.'.log', $this->counter.'=='.$data.PHP_EOL.'--------------------'.PHP_EOL, FILE_APPEND);
        $result = json_decode($data, TRUE);
        if(is_array($result)){
        	$this->end('openai 恳求过错:'.json_encode($result));
        	return strlen($data);
        }
        /*
            此处过程仅针对 openai 接口而言
            每次触发回调函数时,里面会有多条data数据,需求切割
            如某次收到 $data 如下所示:
            data: {"id":"chatcmpl-6wimHHBt4hKFHEpFnNT2ryUeuRRJC","object":"chat.completion.chunk","created":1679453169,"model":"gpt-3.5-turbo-0301","choices":[{"delta":{"role":"assistant"},"index":0,"finish_reason":null}]}\n\ndata: {"id":"chatcmpl-6wimHHBt4hKFHEpFnNT2ryUeuRRJC","object":"chat.completion.chunk","created":1679453169,"model":"gpt-3.5-turbo-0301","choices":[{"delta":{"content":"以下"},"index":0,"finish_reason":null}]}\n\ndata: {"id":"chatcmpl-6wimHHBt4hKFHEpFnNT2ryUeuRRJC","object":"chat.completion.chunk","created":1679453169,"model":"gpt-3.5-turbo-0301","choices":[{"delta":{"content":"是"},"index":0,"finish_reason":null}]}\n\ndata: {"id":"chatcmpl-6wimHHBt4hKFHEpFnNT2ryUeuRRJC","object":"chat.completion.chunk","created":1679453169,"model":"gpt-3.5-turbo-0301","choices":[{"delta":{"content":"运用"},"index":0,"finish_reason":null}]}
            最终两条一般是这样的:
            data: {"id":"chatcmpl-6wimHHBt4hKFHEpFnNT2ryUeuRRJC","object":"chat.completion.chunk","created":1679453169,"model":"gpt-3.5-turbo-0301","choices":[{"delta":{},"index":0,"finish_reason":"stop"}]}\n\ndata: [DONE]
            依据以上 openai 的数据格式,切割过程如下:
        */
        // 0、把上次缓冲区内数据拼接上本次的data
        $buffer = $this->data_buffer.$data;
        // 1、把一切的 'data: {' 替换为 '{' ,'data: [' 换成 '['
        $buffer = str_replace('data: {', '{', $buffer);
        $buffer = str_replace('data: [', '[', $buffer);
        // 2、把一切的 '}\n\n{' 替换维 '}[br]{' , '}\n\n[' 替换为 '}[br]['
        $buffer = str_replace('}'.PHP_EOL.PHP_EOL.'{', '}[br]{', $buffer);
        $buffer = str_replace('}'.PHP_EOL.PHP_EOL.'[', '}[br][', $buffer);
        // 3、用 '[br]' 切割成多行数组
        $lines = explode('[br]', $buffer);
        // 4、循环处理每一行,关于最终一行需求判别是否是完好的json
        $line_c = count($lines);
        foreach($lines as $li=>$line){
            if(trim($line) == '[DONE]'){
                //数据传输完毕
                $this->data_buffer = '';
                $this->counter = 0;
                $this->sensitive_check();
                $this->end();
                break;
            }
            $line_data = json_decode(trim($line), TRUE);
            if( !is_array($line_data) || !isset($line_data['choices']) || !isset($line_data['choices'][0]) ){
                if($li == ($line_c - 1)){
                    //假如是最终一行
                    $this->data_buffer = $line;
                    break;
                }
                //假如是中心行无法json解析,则写入过错日志中
                file_put_contents('./log/error.'.$this->qmd5.'.log', json_encode(['i'=>$this->counter, 'line'=>$line, 'li'=>$li], JSON_UNESCAPED_UNICODE|JSON_PRETTY_PRINT).PHP_EOL.PHP_EOL, FILE_APPEND);
                continue;
            }
            if( isset($line_data['choices'][0]['delta']) && isset($line_data['choices'][0]['delta']['content']) ){
            	$this->sensitive_check($line_data['choices'][0]['delta']['content']);
            }
        }
        return strlen($data);
    }

灵敏词检测

咱们运用了 DFA 算法来完成灵敏词检测,依照 ChatGPT 的解说,"DFA"是指“确定性有限自动机”(Deterministic Finite Automaton) ,DfaFilter(确定有限自动机过滤器)通常是指一种用于文本处理和匹配的算法

Class.DFA.php 类代码是 GPT4 写的,详细完成代码见源码

这儿介绍一下运用方法,创立一个 DFA 实例需求传入灵敏词文件路径:

$dfa = new DFA([    'words_file' => './sensitive_words_sdfdsfvdfs5v56v5dfvdf.txt',
]);

特别阐明:这儿特意用乱码字符串文件名是为了防止他人下载灵敏词文件,请你布置后也自己改一个其他乱码文件名,不要运用我这儿公开了的文件名

之后就能够用 $dfa->containsSensitiveWords($inputText) 来判别 $inputText 是否包括灵敏词,回来值是 TRUE 或 FALSE 的布尔值,也能够用 $outputText = $dfa->replaceWords($inputText) 来进行灵敏词替换,一切在 sensitive_words.txt 中指定的灵敏词都会被替换为三个*号。

假如不想敞开灵敏词检测,把 chat.php 中的以下三句注释掉即可:

$dfa = new DFA([    'words_file' => './sensitive_words_sdfdsfvdfs5v56v5dfvdf.txt',
]);$chat->set_dfa($dfa);

假如没有敞开灵敏词检测,那么每次 OpenAI 的回来都会实时回来给前端。

假如敞开了灵敏词检测,会查找 OpenAI 回来中的换行符和中止符号 [',', '。', ';', '?', '!', '……'] 等来进行分句,每一句都运用 $outputText = $dfa->replaceWords($inputText) 来替换灵敏词,之后整句回来给前端。

敞开灵敏词后,加载灵敏词文件需求时刻,每次检测时也是逐句检测,而不是逐词检测,也会导致回来变慢。

所以假如是自用,能够不敞开灵敏词检测,假如是布置出去给其他人用,为了保护你的域名安全和你的安全,最好敞开灵敏词检测。

流式回来给前端

直接看 chat.php 的注释会更清楚:

/*
以下几行注释由 GPT4 生成
*/
// 这行代码用于封闭输出缓冲。封闭后,脚本的输出将当即发送到浏览器,而不是等待缓冲区填满或脚本执行完毕。
ini_set('output_buffering', 'off');
// 这行代码禁用了 zlib 紧缩。通常情况下,启用 zlib 紧缩能够减小发送到浏览器的数据量,但关于服务器发送事情来说,实时性更重要,因此需求禁用紧缩。
ini_set('zlib.output_compression', false);
// 这行代码运用循环来清空一切当前激活的输出缓冲区。ob_end_flush() 函数会改写并封闭最内层的输出缓冲区,@ 符号用于按捺或许出现的过错或正告。
while (@ob_end_flush()) {}
// 这行代码设置 HTTP 呼应的 Content-Type 为 text/event-stream,这是服务器发送事情(SSE)的 MIME 类型。
header('Content-Type: text/event-stream');
// 这行代码设置 HTTP 呼应的 Cache-Control 为 no-cache,告知浏览器不要缓存此呼应。
header('Cache-Control: no-cache');
// 这行代码设置 HTTP 呼应的 Connection 为 keep-alive,保持长衔接,以便服务器能够持续发送事情到客户端。
header('Connection: keep-alive');
// 这行代码设置 HTTP 呼应的自定义头部 X-Accel-Buffering 为 no,用于禁用某些代理或 Web 服务器(如 Nginx)的缓冲。
// 这有助于保证服务器发送事情在传输过程中不会受到缓冲影响。
header('X-Accel-Buffering: no');
echo 'data: '.json_encode(['time'=>date('Y-m-d H:i:s'), 'content'=>'答: ']).PHP_EOL.PHP_EOL;
flush();

这儿咱们定义了咱们自己运用的一个数据格式,里面只放了 time 和 content ,不必解说都懂,time 是时刻, content 便是咱们要回来给前端的内容。

注意,答复悉数传输完毕后,咱们需求封闭衔接,能够用以下代码:

echo 'retry: 86400000'.PHP_EOL; // 告知前端假如产生过错,隔多久之后才轮询一次
echo 'event: close'.PHP_EOL; // 告知前端,完毕了,该说再见了
echo 'data: Connection closed'.PHP_EOL.PHP_EOL; // 告知前端,衔接已封闭
flush();

EventSource

前端 js 经过 const eventSource = new EventSource(url); 敞开一个 EventSource 恳求。

之后服务器依照 data: {"kev1":"value1","kev2":"value2"} 格式向前端发送数据,前端就能够在 EventSource 的 message 回调事情中的 event.data 里获取 {"kev1":"value1","kev2":"value2"} 字符串形式 json 数据,再经过 JSON.parse(event.data) 就能够得到 js 对象。

详细代码在 getAnswer 函数中,如下所示:

function getAnswer(inputValue){
    inputValue = inputValue.replace('+', '{[$add$]}');
    const url = "./chat.php?q="+inputValue;
    const eventSource = new EventSource(url);
    eventSource.addEventListener("open", (event) => {
        console.log("衔接已建立", JSON.stringify(event));
    });
    eventSource.addEventListener("message", (event) => {
        //console.log("接纳数据:", event);
        try {
            var result = JSON.parse(event.data);
            if(result.time && result.content ){
                answerWords.push(result.content);
                contentIdx += 1;
            }
        } catch (error) {
            console.log(error);
        }
    });
    eventSource.addEventListener("error", (event) => {
        console.error("产生过错:", JSON.stringify(event));
    });
    eventSource.addEventListener("close", (event) => {
        console.log("衔接已封闭", JSON.stringify(event.data));
        eventSource.close();
        contentEnd = true;
        console.log((new Date().getTime()), 'answer end');
    });
}

阐明一下,原生的 EventSource 恳求,只能是 GET 恳求,所以这儿演示时,直接把发问放到 GET 的 URL 参数里了。
假如要想用 POST 恳求,一般有两种方法:

  1. 前后端一起改:【先发 POST 后发 GET 】用 POST 向后端发问,后端依据发问和时刻生成一个仅有 key 跟着 POST 恳求回来给前端,前端拿到后,再建议一个 GET 恳求,在参数里带着问题 key ,获取答复,这种方式需求修正后端代码;

  2. 只改前端:【只发一个 POST 恳求】后端代码不必大改,只需求把 chat.php 中 $question = urldecode($_GET['q'] ?? '') 改为 $question = urldecode($_POST['q'] ?? '') 即可,但是前端需求改造,不能用原生 EventSource 恳求,需求用 fetch ,设置流式接纳,详细可见下方 GPT4 给出的代码示例。

async function fetchAiResponse(message) {
    try {
        const response = await fetch("./chat.php", {
            method: "POST",
            headers: { "Content-Type": "application/json" },
            body: JSON.stringify({ messages: [{ role: "user", content: message }] }),
        });
        if (!response.ok) {
            throw new Error(response.statusText);
        }
        const reader = response.body.getReader();
        const decoder = new TextDecoder("utf-8");
        while (true) {
            const { value, done } = await reader.read();
            if (value) {
                const partialResponse = decoder.decode(value, { stream: true });
                displayMessage("assistant", partialResponse);
            }
            if (done) {
                break;
            }
        }
    } catch (error) {
        console.error("Error fetching AI response:", error);
        displayMessage("assistant", "Error: Failed to fetch AI response.");
    }
}

上方代码,要害点在于 const partialResponse = decoder.decode(value, { stream: true }) 中的 { stream: true } 。

打字机效果

关于后端回来的一切回复内容,咱们需求用打字机形式打印出来。

开端的方案是每次接纳到后端的回来后就当即显现到页面里,后来发现这样速度太快了,眨眼就显现完了,没有打印机效果。
所以后来的方案就改成了用守时器完成守时打印,那么就需求把收到的先放进数组里缓存起来,然后守时每 50 毫秒执行一次,打印一个内容出来。
详细完成代码如下:

function typingWords(){    if(contentEnd && contentIdx==typingIdx){        clearInterval(typingTimer);
        answerContent = '';
        answerWords = [];
        answers = [];
        qaIdx += 1;
        typingIdx = 0;
        contentIdx = 0;
        contentEnd = false;
        lastWord = '';
        lastLastWord = '';
        input.disabled = false;
        sendButton.disabled = false;        console.log((new Date().getTime()), 'typing end');        return;
    }    if(contentIdx<=typingIdx){        return;
    }    if(typing){        return;
    }
    typing = true;    if(!answers[qaIdx]){
        answers[qaIdx] = document.getElementById('answer-'+qaIdx);
    }    const content = answerWords[typingIdx];    if(content.indexOf('`') != -1){        if(content.indexOf('```') != -1){
            codeStart = !codeStart;
        }else if(content.indexOf('``') != -1 && (lastWord + content).indexOf('```') != -1){
            codeStart = !codeStart;
        }else if(content.indexOf('`') != -1 && (lastLastWord + lastWord + content).indexOf('```') != -1){
            codeStart = !codeStart;
        }
    }
    lastLastWord = lastWord;
    lastWord = content;
    answerContent += content;
    answers[qaIdx].innerHTML = marked.parse(answerContent+(codeStart?'\n\n```':''));
    typingIdx += 1;
    typing = false;
}

代码渲染

假如严格依照输出什么打印什么的话,那么当正在打印一段代码,需求比及代码悉数打完,才干被格式化为代码块,才干高亮显现代码。
那这个体会也太差了。
有什么方法能够处理这个问题呢?
答案就在问题里,既然是由于代码块有开端符号没有完毕符号,那就咱们给他补全完毕符号就好了,直到真的完毕符号来了,才不需求补全。

详细的完成便是下面几行代码:

if(content.indexOf('`') != -1){    if(content.indexOf('```') != -1){
        codeStart = !codeStart;
    }else if(content.indexOf('``') != -1 && (lastWord + content).indexOf('```') != -1){
        codeStart = !codeStart;
    }else if(content.indexOf('`') != -1 && (lastLastWord + lastWord + content).indexOf('```') != -1){
        codeStart = !codeStart;
    }
}
lastLastWord = lastWord;
lastWord = content;
answerContent += content;
answers[qaIdx].innerHTML = marked.parse(answerContent+(codeStart?'\n\n```':''));

其它

更多其它细节请看代码,假如对代码有疑问的,请加我微信(同 GitHub id)

目录结构

/
├─ /class
│  ├─ Class.ChatGPT.php
│  ├─ Class.DFA.php
│  ├─ Class.StreamHandler.php
├─ /static
│  ├─ css
│  │  ├─ chat.css
│  │  ├─ monokai-sublime.css
│  ├─ js
│  │  ├─ chat.js
│  │  ├─ highlight.min.js
│  │  ├─ marked.min.js
├─ /chat.php
├─ /index.html
├─ /README.md
├─ /sensitive_words.txt
目录/文件阐明
/程序根目录
/classphp类文件目录
/class/Class.ChatGPT.phpChatGPT 类,用于处理前端恳求,并向 OpenAI 接口提交恳求
/class/Class.DFA.phpDFA 类,用于灵敏词校验和替换
/class/Class.StreamHandler.phpStreamHandler 类,用于实时处理 OpenAI 流式回来的数据
/static寄存一切前端页面所需的静态文件
/static/css寄存前端页面一切的 css 文件
/static/css/chat.css前端页面谈天款式文件
/static/css/monokai-sublime.csshighlight 代码高亮插件的主题款式文件
/static/js寄存前端页面一切的 js 文件
/static/js/chat.js前端谈天交互 js 代码
/static/js/highlight.min.js代码高亮 js 库
/static/js/marked.min.jsmarkdown 解析 js 库
/chat.php前端谈天恳求的后端进口文件,在这儿引进 php 类文件
/index.html前端页面 html 代码
/README.md仓库描述文件
/sensitive_words.txt灵敏词文件,一行一个灵敏词,需求你自己搜集灵敏词,也能够加我微信(同 GitHub id)找我要

根据以上原理,我完成了一个 demo ,开源到了 Github 上,欢迎 star 和 fork 。
项目地址: github.com/qiayue/php-…

运用方法

本项目代码,没有运用任何框架,也没有引进任何第三方后端库,前端引进了代码高亮库 highlight 和 markdown 解析库 marked 都已经下载项目内了,所以拿到代码不必任何安装即可直接运用。

唯二要做的便是把你自己的 api key 填进去。

获取源码后,修正 chat.php ,填写 OpenAI 的 api key 进去,详细请见:

$chat = new ChatGPT([
    'api_key' => '此处需求填入 openai 的 api key ',
]);

假如敞开灵敏词检测功用,需求把灵敏词一行一个放入 sensitive_words_sdfdsfvdfs5v56v5dfvdf.txt 文件中。