11月8日,中國人民銀行數字貨幣研究所、深圳金融科技研究院(中國人民銀行金融科技研究院)一項名為“一種測試數據的生成方法和裝置”的發明專利授權公告。其申請于2023年11月16日,涉及人工智能技術領域。
方法包括:響應于接收到測試結果,確定與測試結果所包括的問題相關聯的測試數據;確定測試數據的數據構造策略(步驟A,下有詳述);將測試數據和數據構造策略輸入預先設置的大語言模型(步驟B,下有詳述),使用輸入完成后的大語言模型生成新測試數據。
而在接收到測試結果之前,需要:響應于接收到樣例數據,確定樣例數據的數據構造策略,將樣例數據和樣例數據的數據構造策略輸入大語言模型,使用大語言模型生成初始測試數據;使用初始測試數據對待測試系統進行測試,得到測試結果。
更具體的,確定測試數據的數據構造策略(步驟A),包括:從預先設置的數據構造策略集中篩選出與測試數據匹配的目標數據構造策略。而在將測試數據和數據構造策略輸入預先設置的大語言模型之前,需要:接收自定義數據構造策略,將自定義數據構造策略和目標數據構造策略作為輸入大語言模型的數據構造策略。
在將測試數據和數據構造策略輸入預先設置的大語言模型之前,還需要:識別出自定義數據構造策略和目標數據構造策略所包括的關鍵詞,對關鍵詞進行標記。因此,將測試數據和數據構造策略輸入預先設置的大語言模型(步驟B),包括:將測試數據和包括標記后的關鍵詞的自定義數據構造策略、目標數據構造策略輸入大語言模型。
此外,響應于接收到補充說明,從關鍵詞中確定與補充說明匹配的目標關鍵詞,將補充說明和目標關鍵詞進行關聯;將與目標關鍵詞關聯的補充說明輸入大語言模型。
值得注意的是,該方法中,需要:判斷新測試數據是否符合預先設置的數據規范;在新測試數據不符合數據規范的情況下,響應于接收到新數據構造策略,根據新數據構造策略調整新測試數據,使調整后的新測試數據符合數據規范。
權利要求書提到,在將測試數據和數據構造策略輸入預先設置的大語言模型之前,方法還包括:響應于接收到訓練數據,根據訓練數據所屬的業務領域對訓練數據進行分類;使用分類后的多組訓練數據分別對預先設置的通用大模型進行微調,得到應用于不同業務領域的多個大語言模型;根據測試數據所屬的業務領域,從多個大語言模型中確定目標大語言模型。因此,將測試數據和數據構造策略輸入預先設置的大語言模型(步驟B),還包括:將測試數據和數據構造策略輸入目標大語言模型。
說明書提到該發明的背景為,在進行軟件測試之前需要先準備測試數據,測試數據的質量往往能夠決定軟件測試的效果,例如,數據量大、數據格式豐富、數據取值范圍隨機的測試數據能夠幫助用戶發現盡可能多的問題,達到較好的測試效果。在準備測試數據時,通常由人工直接編寫測試數據,或者根據人工編寫的生成腳本批量生成測試數據。
但是,現有技術至少存在如下問題:人工編寫的測試數據或者腳本通常受編寫者的知識背景、編寫習慣的影響,導致得到的測試數據缺乏隨機性,僅能夠測試出軟件的部分問題,軟件測試效率較低。
該發明根據與測試結果中的問題相關的測試數據和數據構造策略生成新測試數據,能夠提高測試數據的隨機性,有利于測試出更多的問題,提高軟件測試效率,降低人力成本。
責任編輯:陳愛
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。