楼主你好,我最近也在研究代码补全.但是发现大部分都是代码生成,二者还是有一些区别的
例如
用户输入完整的单词import tensorflow,然后生成后面的as tf
EXP:generate("import tensorflow") > import tensorflow as tf
用户输入 import ten,期望模型输出import tensorflow as tf
EXP:completion("import ten") > import tensorflow as tf
实际上 generate("import ten") > import ten_pence(0.01),会生成很多无意义的代码
我偶尔看到有人提到过可以在BPE分词前将 tensorflow这种词打断,但是自己实践后发现效果依然不佳.
想请教下有什么好的方法可以解决这种情况吗?
期待你的回复
楼主你好,我最近也在研究代码补全.但是发现大部分都是代码生成,二者还是有一些区别的
例如
实际上
generate("import ten")>import ten_pence(0.01),会生成很多无意义的代码我偶尔看到有人提到过可以在BPE分词前将
tensorflow这种词打断,但是自己实践后发现效果依然不佳.想请教下有什么好的方法可以解决这种情况吗?
期待你的回复