2025夏-B-3 AI助教的计费
该比赛已结束,您无法在比赛模式下递交该题目。您可以点击“在题库中打开”以普通模式查看和递交本题。
题目描述
拼题A系统的 AI 助教是基于大语言模型(英文:Large Language Model,缩写 LLM)来生成对话的,目前其计费以 Token 为单位。Token 是模型处理文本的最小单位,在本题中我们将其简单定义为一个单词或标点符号。 AI 助教在与学生对话时,并不会记住自己之前的回答,而是将之前全部对话内容都当成一次输入,来生成新的回复。例如下列对话:
学生:Hello! Who are you?
AI:Hi! I am AI, your teaching assistant.
学生:Now how can you help me?
AI:Anyway you like, except cheating.
在这段对话中,学生第一次输入了 6 个 Tokens(即“Hello”、“!”、“Who”、“are”、“you”、“?”),AI 的第一次回答输出了 10 个 Tokens;学生第二个问题虽然只有 7 个 Tokens,但 AI 第二次回答是基于前面三句话共 23 个 Tokens 产生的,所以第二句话的输入是 6+10+7=23 个Tokens,其输出的回答包含了 7 个 Tokens。所以上述对话一共产生了 6+23=29 个输入的 Tokens,以及 10+7=17 个输出的 Tokens。 对于给定的一段对话,本题就请你分别统计一下输入和输出的 Token 量。
输入格式
输入由若干行语句组成。每行以 X:
开头,其中 X
为 S
代表这句话是学生输入的,为 A
代表这句话是 AI 助教输出的,为#
则表示对话结束(即这行不要处理,结束程序)。随后的语句仅由英文字母和标点符号 ,
、.
、?
、!
以及空格组成,总长度不超过 1000 个字符,最后以回车结束。
输出格式
在一行中输出 2 个数字,依次为本次对话产生的输入和输出的 Token 个数。数字间以 1 个空格分隔,行首尾不得有多余空格。题目保证输出的 2 个数字均不超过 。 注意: 1、本题定义 Token 为一个单词或标点符号。所谓“单词”,是指完全由英文字母组成的、连续不含空格和标点符号的字符串。 2、只有当 AI 产生回答的时候,这个回答之前的内容才作为输入进行统计。如果提问后没等 AI 回答就关闭了对话,则提问内容不算在输入 Token 里。 3、题目保证对话中没有连续的问和连续的答,只有一问跟一答。
样例
S: Hello! Who are you?
A: Hi! I am AI, your teaching assistant.
S: Now how can you help me?
A: Anyway you like, except cheating.
S: Thank you!
A: You are welcome.
S: That is all.
#:
62 21
限制
400 ms, 256 MB for each test case.