Fuzzywuzzy یک کتابخانه پایتون است که از فاصله Levenshtein برای محاسبه تفاوت بین دنباله ها و الگوها استفاده می کند که توسط SeatGeek توسعه یافته و همچنین منبع باز است، سرویسی که بلیط های رویداد را از در سراسر اینترنت و نمایش آنها در یک پلت فرم.
FuzzyWuzzy در پایتون چیست؟
FuzzyWuzzy کتابخانه ای از پایتون است که برای تطبیق رشتهاستفاده می شود. تطبیق رشته فازی فرآیند یافتن رشته هایی است که با یک الگوی داده شده مطابقت دارند. اساساً از فاصله لونشتاین برای محاسبه تفاوت بین دنباله ها استفاده می کند.
نسبت مجموعه توکن در FuzzyWuzzy چیست؟
Token Set Ratio با استفاده از FuzzyWuzzy
Token set ratio عملیاتی را انجام می دهد که به جای توکن کردن رشته ها، مرتب سازی و سپس چسباندن، عملیات مجموعه ای را انجام می دهد. توکن ها دوباره کنار هم کلمات تکراری اضافی یا مشابه مهم نیست.
مثال تطبیق فازی چیست؟
تطبیق فازی (همچنین به آن تطبیق رشته تقریبی نیز گفته می شود) تکنیکی است که کمک می کند تا دو عنصر متن، رشته ها یا ورودی هایی را شناسایی کنید که تقریباً مشابه هستند اما دقیقاً یکسان نیستند برای به عنوان مثال، بیایید مورد هتل های فهرست شده در نیویورک را در نظر بگیریم که توسط Expedia و Priceline در نمودار زیر نشان داده شده است.
Token_sort_ratio برای چه مواردی استفاده می شود:-?
token_sort_ratio، نشانههای رشته بر اساس حروف الفبا مرتب میشوند و سپس به هم میپیوندند. پس از آن، یک فاز ساده. نسبت برای به دست آوردن درصد شباهت اعمال می شود. این به مواردی مانند پرونده های دادگاه در این مثال اجازه می دهد تا به عنوان یکسان علامت گذاری شوند.