Embedding 是一种将文字、图像或其他形式的资料转换为向量表示的技术。OpenAI 提供的 Embedding API 透过大量文本的训练, 可以将任意文字转换为多维向量的形式,并且使相似的文字在向量空间中的距离更近。这些向量可以被用于搜索(Search)、聚类(Clustering)、 推荐(Recommendations)、异常检测(Anomaly detection)、多样性测量(Diversity measurement)、分类(Classification)。
财经M平方运用 OpenAI 的 Embedding API 计算每篇美联储声明稿的一致性程度,并将每篇声明稿转换为向量。一致性程度的算法为 1 - 向量距离, 其中距离以余弦相似度(Cosine similarity)计算。横轴与纵轴都是声明稿的日期,颜色越红(数值越高)代表两篇声明稿的一致性程度越高。
可以藉由一致性热点图判断美联储的态度是否改变,例如 2020 年 3 月至 2021 年底的声明稿彼此一致性程度高, 此期间刚好为疫情发生后美联储实施宽鬆政策时期。而 2022 年后美联储开启升息循环后的声明稿与宽鬆时期相比就明显降低