Forwarded from Machinelearning
🚀Только что выпущено новое семейство моделей генерации кода Salesforce (SFR-Embedding-Code), занявшее 1-е место на бенчмарке CoIR!
Модель доступна в в 2-х размерах: 2B, 400M.
Основные характеристики:
1️⃣ Модель 2B: Занимает первое место в CoIR.
2️⃣ Модель 400M: демонстрирует лучшие показатели среди моделей на 0,5B параметров.
3️⃣ Поддерживает 12 языков программирования,
Пример Запуска:
✅Документация
✅Модель 400M
✅ Модель 2B
📌Лицензирование моделей: CC-BY-NC-SA-4.0 License.
#CodeAI #MLResearch #SOTA #OpenScience #code #llm #ml
Модель доступна в в 2-х размерах: 2B, 400M.
Основные характеристики:
1️⃣ Модель 2B: Занимает первое место в CoIR.
2️⃣ Модель 400M: демонстрирует лучшие показатели среди моделей на 0,5B параметров.
3️⃣ Поддерживает 12 языков программирования,
Python, Java, C++, JavaScript, C#
и другие!Пример Запуска:
import torch.nn.functional as F
from transformers import AutoTokenizer, AutoModel
# Each query needs to be accompanied by an corresponding instruction describing the task.
query_instruction_example = "Given Code or Text, retrieval relevant content"
queries = [
"how to implement quick sort in Python?"
]
# No instruction needed for retrieval passages
passages = [
"def quick_sort(arr):\n if len(arr) <= 1:\n return arr\n pivot = arr[len(arr) // 2]\n left = [x for x in arr if x < pivot]\n middle = [x for x in arr if x == pivot]\n right = [x for x in arr if x > pivot]\n return quick_sort(left) + middle + quick_sort(right)",
"def bubble_sort(arr):\n n = len(arr)\n for i in range(n):\n for j in range(0, n-i-1):\n if arr[j] > arr[j+1]:\n arr[j], arr[j+1] = arr[j+1], arr[j]\n return arr"
]
# load model with tokenizer
model = AutoModel.from_pretrained('Salesforce/SFR-Embedding-Code-2B_R', trust_remote_code=True)
# get the embeddings
max_length = 32768
query_embeddings = model.encode_queries(queries, instruction=query_instruction_example, max_length=max_length)
passage_embeddings = model.encode_corpus(passages, max_length=max_length)
# normalize embeddings
query_embeddings = F.normalize(query_embeddings, p=2, dim=1)
passage_embeddings = F.normalize(passage_embeddings, p=2, dim=1)
scores = (query_embeddings @ passage_embeddings.T) * 100
print(scores.tolist())
✅Документация
✅Модель 400M
✅ Модель 2B
📌Лицензирование моделей: CC-BY-NC-SA-4.0 License.
#CodeAI #MLResearch #SOTA #OpenScience #code #llm #ml
tgoop.com/pro_python_code/1687
Create:
Last Update:
Last Update:
🚀Только что выпущено новое семейство моделей генерации кода Salesforce (SFR-Embedding-Code), занявшее 1-е место на бенчмарке CoIR!
Модель доступна в в 2-х размерах: 2B, 400M.
Основные характеристики:
1️⃣ Модель 2B: Занимает первое место в CoIR.
2️⃣ Модель 400M: демонстрирует лучшие показатели среди моделей на 0,5B параметров.
3️⃣ Поддерживает 12 языков программирования,
Пример Запуска:
✅Документация
✅Модель 400M
✅ Модель 2B
📌Лицензирование моделей: CC-BY-NC-SA-4.0 License.
#CodeAI #MLResearch #SOTA #OpenScience #code #llm #ml
Модель доступна в в 2-х размерах: 2B, 400M.
Основные характеристики:
1️⃣ Модель 2B: Занимает первое место в CoIR.
2️⃣ Модель 400M: демонстрирует лучшие показатели среди моделей на 0,5B параметров.
3️⃣ Поддерживает 12 языков программирования,
Python, Java, C++, JavaScript, C#
и другие!Пример Запуска:
import torch.nn.functional as F
from transformers import AutoTokenizer, AutoModel
# Each query needs to be accompanied by an corresponding instruction describing the task.
query_instruction_example = "Given Code or Text, retrieval relevant content"
queries = [
"how to implement quick sort in Python?"
]
# No instruction needed for retrieval passages
passages = [
"def quick_sort(arr):\n if len(arr) <= 1:\n return arr\n pivot = arr[len(arr) // 2]\n left = [x for x in arr if x < pivot]\n middle = [x for x in arr if x == pivot]\n right = [x for x in arr if x > pivot]\n return quick_sort(left) + middle + quick_sort(right)",
"def bubble_sort(arr):\n n = len(arr)\n for i in range(n):\n for j in range(0, n-i-1):\n if arr[j] > arr[j+1]:\n arr[j], arr[j+1] = arr[j+1], arr[j]\n return arr"
]
# load model with tokenizer
model = AutoModel.from_pretrained('Salesforce/SFR-Embedding-Code-2B_R', trust_remote_code=True)
# get the embeddings
max_length = 32768
query_embeddings = model.encode_queries(queries, instruction=query_instruction_example, max_length=max_length)
passage_embeddings = model.encode_corpus(passages, max_length=max_length)
# normalize embeddings
query_embeddings = F.normalize(query_embeddings, p=2, dim=1)
passage_embeddings = F.normalize(passage_embeddings, p=2, dim=1)
scores = (query_embeddings @ passage_embeddings.T) * 100
print(scores.tolist())
✅Документация
✅Модель 400M
✅ Модель 2B
📌Лицензирование моделей: CC-BY-NC-SA-4.0 License.
#CodeAI #MLResearch #SOTA #OpenScience #code #llm #ml
BY Python RU
![](https://photo2.tgoop.com/u/cdn4.cdn-telegram.org/file/nRWTHQvOlAYqbPr4P2AcPskS1WsfJqJKFs8dxmE1RdF6tsEAxrcAp16T09ph9fZZDrWbzs8Mzi2aItF_-KHThw0h3vYG8JTBof-ZbEOfv4W7oWMvLhrQB6zD2vFBoZ-C6BqQ0lA_kplBfGWs1Khr9QsEkD7ev6aBGytpXrXIrj9amDOyTRUKxcdJi9FV3TyjHnLxp3Y_Bw1QPv_PO1HJml840IgR3YE8h1zWMdLyNoAJYQ2My4SLHw8kVZtz0wAPOeWuYAXWgoLbSE4J0xu-BLqs8_gFVp8wrxTgKTF5OtOmlb3WNlsvrJAHipcYts7nseuvsjJxarVfOuflUkcWgg.jpg)
![](https://photo2.tgoop.com/u/cdn4.cdn-telegram.org/file/rcaV9pE-tBfgVJwm2vtzQcLkDarGR2vkhx-cAxvzwLOGDZ3JbPBUoFc6Gsd3xD5e3S6FcXOt9dOjt1cgQMwUVPIy7WWx_oAvkh8BKFJBm1XyENl9tRSgUSrt8FTtUhuhHDDI8sPhX-haLd9BFcPD0qpQuEOovdg3-O5BAVL5sxwpnF7H4y_T82jrYcOG6E5XzU3zZmwi-A3OIeLB2Cs-qMKsyVB3jvzOiKXpRgqEVjU1FMDZ1pdpU9IVWFaooS_KWR7gWEfQaHdo6q3xGc9bkKvdIR3H5oa0bDXWHeou4TyXidipFtQ-NUY2-M1314PMU3BHS5NfqOCPEFNALA1gHQ.jpg)
![](https://photo2.tgoop.com/u/cdn4.cdn-telegram.org/file/cdCPyNfgGf5YUf96zOCbC0Z_hTdJvkl3pQJboDjvfTTSLxEgO-el88pllM-COGH_N5JNpCGBIhweMVP5NiXTZiS4TfJIl3c7KxAcTXXycFc9ukGiuv3w6lc673FU_3w-sCnrBNBkpz4I0yMf8JN2BQrI4W6Gt5A-eRavI5BZaBNlz7jvOWd0PluT1CqoGvHE2AOzxrmPH340RJvSEc_OPjgmPziuI7iSks6kZBidkFpb4j1BRFkZSQ39Z250XVAdry2EHcICge041yvELfzthxJEiTcVORd7VdH8sgFsCWF-I17gQLK-bkUDLEumJPk0b3OeGkifk4Yg_SS87HY57g.jpg)
![](https://photo2.tgoop.com/u/cdn4.cdn-telegram.org/file/FCcVkUSgIYdcFSLLPCs9_DdlTeJptVtNeV0eYiTe7-Oyz8FomNCZ0F8nIpAc57I3GKEGYkMljiNnwbE1NZo6sZCIMWNVpTRSLYbCixR5a4GV19tYCoaMulCUHBTU0X-9SIxBctHXDRSz6TX8Evv0XR6waCHH8oF6yqbbAiyyu6b6Qt52JVdp3L6e2CdXhh1WsXiIYvom_gVwBXGzYFBdXUPVeUyphnSMAcZzmpVYRgLoM8y28QlRPRZIv2F5eRPiXZSS-U1VAu2vaJHibHC3nGtkP0W6oCLUa46zPVIUbzWBhrKb-1v-WM01sshN0bt835SMrxM-YMPQ2KXcSXnROA.jpg)
![](https://photo2.tgoop.com/u/cdn4.cdn-telegram.org/file/fcRB1yxK_8HRN8Npl8VXVhQupMO69uPsm1_OlcL2lHcfTEMkWUcmVswCzXMdloGXhoZsvWIeEmrAOT5OTY0wvuQEvqKyrjqYRHSpQy6SHhN8sKY_wKLg4JHxqV1sNvxydgy8lXKiVuLeqrY8TEIJRIIdhohIXrtPxod2E-SM7UniYI5KyXsNxtagGrKKkmCjLZ5-r75AUOtu-9wJTBUeHfdUlRRA-cxQ9jGSyiTUTjx1HnxjGy_xT6UF4n0QYITOMW_DPD8qBbgWOqafyapdwjZUo-O8DSPJcIAZ9zMneLw2BZdW7dGBusmPVS7EMb5wGOVo-r_gA9MIeHHPYsRJvw.jpg)
![](https://photo2.tgoop.com/u/cdn4.cdn-telegram.org/file/e1FlENcB355ombZUWKo5dXFi-ozP0eB1e4gkG0bf06aGjOERNHu_ZDAg8a2yz8BBDE1HWKpDitSpB6tzkLSfjxtW7CuQgm9VhNmPY44_hT0g6Rb0JC57vyujeSQZZdAwnZ2Eek80a4ChY5AvgGGnmpRN0HKFSfzdAl3MSzir6QR7gJ0I9s316wsObLoFSr6-qIYmxlTZLpN3k2uvafcWtIt8m1xY9T82V-RpHzyefBN6laAogE1dGBL0tA7g2AWiDmwIQP77LZAC4K55FYb6wJvqX4sWoATIOunTIRWTWJ2OsR2EUB1Mi9LPgLOf-kSOF1nu5jSNZFRyqo-AtVY4TQ.jpg)
![](https://photo2.tgoop.com/u/cdn4.cdn-telegram.org/file/qFIgbVflP9m_j9Z1Jk8jeUziyXfIWdp68yxb9jeXcgDazoeg0iGrMCIaTCQS62qovcUwauOzQq4rQTFBm4Pq7sNha_rn_RH7eZUUi62FL1r3VnMtIougTdBBhV8-B6FjxMTYkfNUyWGAST3RTQX1wmv56gvPt8bq_TTx9TDuqPhRvZsjST-YildBzEEhVZY5HrNSzyNgaVgg96VVW1zk4uQb1aP6DAK0o56hfEEExohHJptJuRnYMUQr1YQYLkCNhC8-ZppuaVmNl6LjoqZXhLgpkJOTtJqKYWSuY3y3glygjd40qc5gtVhCFZ5s0yeyXFvd8uYIZYcZFeKlGSYElw.jpg)
![](https://photo2.tgoop.com/u/cdn4.cdn-telegram.org/file/C99iwQyZUblKKhycU0T59BMQILkgHrqZBzLTxCDoshP9yFffv2AfZ80uOi_UalsNOX1zp6PxFD8T4Uab7WfNass1WuQLStawWn8QzbRrPGQWJgxKtR6j2f-jmoOT8Qh4YEGtwq-mKLet8OOa1Ua-7rWZLp1KRXndjnQ2LQkSXtrLg2moHZ3qWmDHgG9BJZyNXmze-A8jUSKuFENydvKtQlwDH8vCDPfH9pVTDFZFcO8ghJbvhIguScgMdumdU-MSL26y25X0x0DfW1vUALpy7A0_R5Rcsh5R3PIIlvCsC4-G14qoUCL4sxZZnlaiq47wmv14CuIKeBDOxHA5QwboHw.jpg)
Share with your friend now:
tgoop.com/pro_python_code/1687