கூகிள் பெர்ட் Vs. ஸ்மித் வழிமுறைகள் ஒன்றாக வேலை செய்கின்றன - செமால்ட் கண்ணோட்டம்




கூகிள் சமீபத்தில் தங்கள் புதிய என்எல்பி வழிமுறை ஸ்மித் குறித்த ஆய்வுக் கட்டுரையை வெளியிட்டது. இந்த கட்டுரை பல எஸ்சிஓ நிபுணர்களுக்கு SERP தரவரிசையில் அதிகரிப்பு அல்லது வீழ்ச்சியைக் கொடுக்கும் மாற்றங்கள் குறித்து விளக்கமளித்தது. ஆயினும்கூட, இங்கே எங்கள் கவலை இந்த புதிய ஸ்மித் வழிமுறை BERT உடன் எவ்வாறு ஒப்பிடுகிறது?

கூகிள் வெளியிட்டுள்ள தாளில், நீண்ட தேடல் வினவல்களையும் நீண்ட ஆவணங்களையும் புரிந்து கொள்வதில் ஸ்மித் பெர்ட்டை விட சிறப்பாக செயல்படுவதாக அவர்கள் கூறினர். ஸ்மித்தை மிகவும் சுவாரஸ்யமாக்குவது என்னவென்றால், வார்த்தைகள் மற்றும் வாக்கியங்களுடன் பெர்ட் என்ன செய்கிறதோ அதைப் போன்ற ஒரு ஆவணத்தில் உள்ள பத்திகளைப் புரிந்து கொள்ள முடியும். SMITH இன் இந்த மேம்பட்ட அம்சம் நீண்ட ஆவணங்களை எளிதில் புரிந்துகொள்ள உதவுகிறது.

நாங்கள் மேற்கொண்டு செல்வதற்கு முன்பு, ஸ்மித் கூகிளின் வழிமுறைகளில் வாழவில்லை என்பதை நாங்கள் உங்களுக்குத் தெரிவிக்க வேண்டும். ஆனால் எங்கள் ஊகங்கள் சரியாக இருந்தால், அது பத்தியின் குறியீட்டுடன் தொடங்கப்படும், அல்லது அது அதற்கு முன்னதாகவே இருக்கும். சோ.ச.க.வில் எவ்வாறு தரவரிசை பெறுவது என்பதைக் கற்றுக்கொள்வதில் நீங்கள் உண்மையிலேயே ஆர்வமாக இருந்தால், இயந்திர கற்றல் தவிர்க்க முடியாமல் இந்த ஆர்வத்திற்கு அருகருகே செல்லும்.

எனவே மீண்டும் தலைப்புக்கு, BERT மாற்றப்படுமா? வலையில் உள்ள பெரும்பாலான ஆவணங்கள் பரந்த, வலுவான, எனவே நீண்ட காலமாக SMITH உடன் சிறப்பாக செயல்படவில்லையா?

மேலும் முன்னேறி, நாம் என்ன முடிவு செய்தோம் என்று பார்ப்போம். வலுவான மற்றும் மெல்லிய ஆவணங்களைப் படிக்கும் வேலையை ஸ்மித் செய்ய முடியும். ஒரு பஸூக்காவைப் போல நினைத்துப் பாருங்கள். இது கதவுகளைத் திறப்பதன் மூலம் பெரும் சேதத்தை ஏற்படுத்தும்.

தொடங்க, ஏன் பெர்ட் அல்லது ஸ்மித்?

தேடல் முடிவுகளை வழங்க ஒரு தேடுபொறிக்கு இயற்கை கற்றல் செயலாக்கம் ஏன் தேவைப்படுகிறது என்பது இங்கே உண்மையான கேள்வி. பதில் எளிது. தேடுபொறிகள் தேடுபொறி புரிந்துகொள்ளும் சரங்கள் அல்லது முக்கிய வார்த்தைகளிலிருந்து விஷயங்கள் அல்லது வலைப்பக்கங்களுக்கு மாறுவதற்கு என்.எல்.பி தேவைப்படுகிறது.

கூகிளுக்கு ஒரு யோசனை இல்லாத இடத்தில், முக்கிய வார்த்தைகளைத் தவிர வேறு என்ன பக்கத்தில் இருக்க முடியும் அல்லது தேடல் வினவலுடன் தொடர்புடைய உள்ளடக்கம் குறியிடப்படுவது கூட அர்த்தமுள்ளதா. என்.எல்.பிக்கு நன்றி, கூகிள் அதன் தேடல் வினவலில் தட்டச்சு செய்த எழுத்துக்களின் சூழலைப் புரிந்து கொள்ள முடியும்.
என்.எல்.பிக்கு நன்றி, கூகிள் ஒரு பயனரின் "ஆற்றங்கரை" மற்றும் "வங்கிக் கணக்கு" என்று கூறும்போது அவர்களின் நோக்கங்களை வேறுபடுத்தி அறிய முடியும். "கரோலின் தனது நண்பர்களுடன் ஒரு பானம், பானங்கள், பைண்ட், ஆல், ப்ரூ" போன்றவற்றை இயற்கைக்கு மாறானதாக சந்தித்தார்.

எஸ்சிஓ வல்லுநர்களாக, தேடல் வினவலைப் புரிந்துகொள்வது நீண்ட தூரம் வந்துவிட்டது என்று நாம் சொல்ல வேண்டும். கடந்த காலத்தில் இணையத்தில் சரியான கட்டுரைகளைக் கண்டுபிடிப்பது மிகவும் கடினம் என்று சிறந்தவர்கள் நம்புகிறார்கள்.

பெர்ட்டைப் புரிந்துகொள்வது

BERT தற்போது பலவற்றில் நம்மிடம் உள்ள மிகச் சிறந்த NLP மாதிரியாக செயல்படுகிறது, இல்லையெனில், பயன்பாடுகள், குறிப்பாக சிக்கலான மொழி கட்டமைப்புகளைப் புரிந்து கொள்ளும்போது. இந்த வழிமுறையில் முன்னோக்கி செல்லும் மிகப்பெரிய பாய்ச்சலாக முதல் இருதரப்பு பாத்திரத்தை பலர் கருதுகின்றனர். இடமிருந்து வலமாகப் படிக்கும் ஒரு வழிமுறையைக் கொண்டிருப்பதற்குப் பதிலாக, அவற்றின் சூழலுடன் தொடர்புடைய சொற்களையும் BERT புரிந்து கொள்ள முடியும். இந்த வழியில், இது வினவலில் வைக்கப்பட்டுள்ள தனிப்பட்ட சொற்களுக்கான முடிவுகளைத் தராது, ஆனால் தேடல் வினவலில் உள்ள சொற்களின் கூட்டு அர்த்தத்தின் அடிப்படையில் குறியீட்டு வலைப்பக்கங்கள்.

உங்கள் புரிதலை எளிதாக்க இங்கே ஒரு எடுத்துக்காட்டு:

ஒரு டிரக் ஒளி உள்ளது.

அந்த அறிக்கையை இடமிருந்து வலமாக, "ஒளி" என்ற வார்த்தையை அடைந்தவுடன், நீங்கள் டிரக்கை ஒளியுடன் வகைப்படுத்துவீர்கள். அந்த அறிக்கையில் வெளிச்சத்திற்கு முன்பாக டிரக் வந்தது என்பதே அதற்குக் காரணம்.

ஆனால் லாரிகளில் விஷயங்களை வகைப்படுத்த விரும்பினால், "டிரக்" க்கு முன்னால் நாம் அதைக் காணாததால் "வெளிச்சத்தை" விட்டுவிடலாம்.

அறிக்கையை ஒரு திசையில் மட்டும் கருத்தில் கொள்வது கடினம்.

கூடுதலாக, BERT மிகவும் குறிப்பிடத்தக்கதாக இருப்பதன் மற்றொரு ரகசிய நன்மையையும் கொண்டுள்ளது, மேலும் இது முந்தைய மாதிரிகளுடன் ஒப்பிடும்போது குறைந்த வள செலவில் மொழியை திறம்பட செயலாக்க அனுமதிக்கிறது. ஒருவர் அதை முழு வலையிலும் பயன்படுத்த விரும்பும்போது கருத்தில் கொள்ள வேண்டிய முக்கியமான காரணியாகும்.

டோக்கன்களின் பயன்பாடு BERT உடன் இணைந்த மற்றொரு பரிணாமமாகும். BERT இல் 30,000 டோக்கன்கள் உள்ளன, மேலும் இவை ஒவ்வொன்றும் 30,000 க்கு வெளியே ஒரு சொல் இருந்தால், எழுத்துக்கள் மற்றும் துண்டுகளுக்கான சில ஜோடி கூடுதல் டோக்கன்களுடன் பொதுவான வார்த்தையை குறிக்கிறது.

டோக்கன்கள் மற்றும் மின்மாற்றிகளை செயலாக்குவதற்கான அதன் திறனின் மூலம், BERT உள்ளடக்கத்தைப் புரிந்து கொண்டது, இது வாக்கியங்களை போதுமான அளவில் புரிந்து கொள்ளும் திறனையும் அளித்தது.

எனவே, "அந்த இளம் பெண் வங்கிக்குச் சென்றார். பின்னர் அவர் ஆற்றங்கரையில் அமர்ந்து ஆற்றின் ஓட்டத்தைப் பார்த்தார்" என்று நாங்கள் சொன்னால்.

அந்த வாக்கியங்களுக்கு BERT வெவ்வேறு மதிப்புகளை ஒதுக்கும், ஏனெனில் அவை இரண்டு வெவ்வேறு விஷயங்களைக் குறிக்கின்றன.

SMITH ஐப் புரிந்துகொள்வது

பெரிய ஆவணங்களை செயலாக்குவதற்கு சிறந்த ஆதாரங்கள் மற்றும் எண்களைக் கொண்ட ஒரு வழிமுறையான ஸ்மித் வருகிறது. BERT ஒரு ஆவணத்திற்கு சுமார் 256 டோக்கன்களைப் பயன்படுத்துகிறது, மேலும் இது இந்த வரம்பை மீறும் போது, ​​கணினி செலவு உகந்த செயல்பாட்டிற்கு மிக அதிகமாகிறது. இதற்கு மாறாக, ஒரு ஆவணத்திற்கு 2,248 டோக்கன்களை SMITH கையாள முடியும். இது டோக்கன் BERT பயன்பாடுகளின் எண்ணிக்கை 8X ஆகும்.

ஒற்றை என்.எல்.பி மாதிரியில் கணினி செலவுகள் ஏன் அதிகரிக்கின்றன என்பதைப் புரிந்து கொள்ள, ஒரு வாக்கியத்தையும் ஒரு பத்தியையும் புரிந்து கொள்ள என்ன தேவை என்பதை முதலில் நாம் கருத்தில் கொள்ள வேண்டும். ஒரு வாக்கியத்தை கையாளும் போது, ​​புரிந்து கொள்ள ஒரே ஒரு பொதுவான கருத்து மட்டுமே உள்ளது. ஒருவருக்கொருவர் தொடர்பான சொற்கள் குறைவாகவே உள்ளன, எனவே சொற்களுக்கும் அவை நினைவகத்தில் வைத்திருக்கும் கருத்துக்களுக்கும் குறைவான தொடர்புகள் உள்ளன.

வாக்கியங்களை பத்திகளாக மாற்றுவதன் மூலம், இந்த சொற்களுக்கு இடையிலான தொடர்பு பெரிதும் பெருக்கப்படுகிறது. செயல்முறைகள் 8 எக்ஸ் உரைக்கு அதே மாதிரியைப் பயன்படுத்தி வேகம் மற்றும் நினைவக தேர்வுமுறை திறன் இன்னும் பல மடங்கு தேவைப்படும். இங்குதான் ஸ்மித் அனைத்து வேறுபாடுகளையும் அடிப்படையாகக் கொண்டு நிறைய ஆஃப்லைன் செயலாக்கத்தை மேற்கொள்கிறது. சுவாரஸ்யமாக ஸ்மித் இன்னும் சரியாக செயல்பட பெர்ட்டைப் பொறுத்தது.

ஸ்மித் ஒரு ஆவணத்தை அதன் மையத்தில் எவ்வாறு எடுத்துக்கொள்கிறார் என்பதற்கான விளக்கம் இங்கே:
  1. இது முதலில் ஆவணத்தை நிர்வகிக்க எளிதான தொகுத்தல் அளவுகளாக உடைக்கிறது.
  2. இது வாக்கியங்களின் ஒவ்வொரு தொகுதியையும் தனித்தனியாக செயலாக்குகிறது.
  3. ஒரு மின்மாற்றி ஒவ்வொரு தொகுதியின் சூழ்நிலை பிரதிநிதித்துவத்தையும் கற்றுக்கொள்கிறது, அதன் பிறகு அவை ஆவண பிரதிநிதித்துவமாக மாறும்.

ஸ்மித் எவ்வாறு செயல்படுகிறது?

ஸ்மித் மாதிரியைப் பயிற்றுவிக்க, BERT இலிருந்து இரண்டு வழிகளில் கற்றுக்கொள்கிறோம்:

BERT ஐப் பயிற்றுவிக்க, ஒரு வாக்கியத்திலிருந்து ஒரு சொல் எடுக்கப்படுகிறது, மாற்று விருப்பங்கள் வழங்கப்படும்

சிறந்த பயிற்சியளிக்கப்பட்ட BERT, வழங்கப்பட்ட மாற்றுகளிலிருந்து சரியான விருப்பத்தைத் தேர்ந்தெடுப்பதில் மிகவும் வெற்றிகரமாக இருக்கும். எடுத்துக்காட்டாக, BERT க்கு வாக்கியம் வழங்கப்பட்டால்:

மகிழ்ச்சியான பழுப்பு ------ மறியல் வேலிக்கு மேலே குதித்தது.
  • விருப்பம் ஒன்று - தக்காளி.
  • விருப்பம் இரண்டு - நாய்.
சிறந்த பயிற்சி பெற்ற BERT, சரியான விருப்பத்தைத் தேர்ந்தெடுப்பதற்கான வாய்ப்புகள் சிறந்தது, இது விருப்பம் இரண்டு.

இந்த பயிற்சி முறை ஸ்மித் மொழியிலும் பயன்படுத்தப்படுகிறது.

ஸ்மித் பெரிய ஆவணங்களுக்கு பயிற்சி பெற்றவர்

சிறந்த பயிற்சி பெற்ற ஸ்மித், விடுபட்ட வாக்கியங்களை அங்கீகரிப்பதற்கான வாய்ப்புகள் அதிகம். இது BERT உடன் அதே யோசனை ஆனால் வேறு பயன்பாடு. இந்த பகுதி குறிப்பாக சுவாரஸ்யமானது, ஏனென்றால் கூகிள் உருவாக்கிய உள்ளடக்கங்களை சுவர்-இன் தேடுபொறி முடிவு பக்கங்களில் ஒன்றாக இணைத்து உலகத்தை வரைகிறது. நிச்சயமாக, பயனர்கள் வெளியேறலாம், ஆனால் அவர்கள் அவ்வாறு செய்ய மாட்டார்கள், ஏனெனில் கூகிள் அதன் முடிவு பக்கத்தில் உள்ள அனைத்து சிறந்த மூலங்களிலிருந்தும் குறுகிய மற்றும் நீண்ட வடிவ உள்ளடக்கத்தை ஒன்றாக இணைக்க முடியும்.

இது நடப்பதில் உங்களுக்கு சந்தேகம் இருந்தால், அது ஏற்கனவே நடக்கத் தொடங்கியது என்பதை நீங்கள் அறிந்து கொள்ள வேண்டும், மேலும் அவர்கள் அதை இன்னும் தேர்ச்சி பெறவில்லை என்றாலும், இது ஒரு தொடக்கமாகும்.

ஸ்மித்தை பெர்ட்டை விட சிறந்ததா?

நீங்கள் படித்த அனைத்திலும், ஸ்மித் சிறந்தது என்று கருதுவது முற்றிலும் இயற்கையானது, பல பணிகளில், இது உண்மையிலேயே சிறந்தது. ஆனால் ஒரு கணம் இணையத்தை எவ்வாறு பயன்படுத்துகிறீர்கள் என்பதைக் கவனியுங்கள்; தேடல் வினவல்களில் நீங்கள் தொடர்ந்து என்ன கேள்விகளை உள்ளிடுகிறீர்கள்?
  • "இன்றைய வானிலை முன்னறிவிப்பு என்ன?"
  • "ஒரு உணவகத்திற்கான திசைகள்".
இத்தகைய தேடல் கேள்விகளுக்கு பதிலளிக்க பொதுவாக குறுகிய உள்ளடக்கம் தேவைப்படுகிறது, பெரும்பாலும் வரையறுக்கப்பட்ட மற்றும் சிக்கலற்ற தரவு. நீண்ட மற்றும் சிக்கலான ஆவணங்கள் மற்றும் நீண்ட மற்றும் சிக்கலான தேடல் வினவல்களைப் புரிந்து கொள்வதில் ஸ்மித் அதிக ஈடுபாடு கொண்டவர்.

அவற்றின் பதில்களை உருவாக்க பல ஆவணங்கள் மற்றும் தலைப்புகளை ஒன்றாக இணைப்பது இதில் அடங்கும். உள்ளடக்கத்தை எவ்வாறு உடைக்க முடியும் என்பதை இது தீர்மானிக்கிறது, இது காண்பிக்க சரியான விஷயத்தை அறிய Google க்கு உதவுகிறது. உள்ளடக்கத்தின் பக்கங்கள் ஒருவருக்கொருவர் எவ்வாறு தொடர்புபடுகின்றன என்பதைப் புரிந்துகொள்ள இது Google க்கு உதவும், மேலும் இது பிற நன்மைகளுக்கிடையில் இணைப்புகளை மதிப்பிடக்கூடிய அளவை வழங்குகிறது.

அவ்வாறு கூறப்படுவதன் மூலம், பெர்ட் மற்றும் ஸ்மித் இரண்டும் முக்கியமானவை என்று கூறி முடிக்கிறோம், மேலும் அவை இரண்டும் அவற்றின் தனித்துவமான நோக்கத்திற்கு உதவுகின்றன.

முடிவுரை

ஸ்மித் என்பது பாஸூக்காவாக இருக்கும்போது, ​​விஷயங்கள் எவ்வாறு கூட்டாக இருக்கின்றன என்பதற்கான தெளிவான படத்தை வரைவதற்கு நமக்கு இது தேவை. வளங்களில், இது ஒரு பெரிய வேலையைச் செய்வதால் அதிக செலவு செய்கிறது, ஆனால் அதே வேலையைச் செய்யும்போது BERT ஐ விட மிகக் குறைவாக செலவாகும்.

குறுகிய வினவல்கள் மற்றும் சிறிய உள்ளடக்க துகள்களைப் புரிந்துகொள்ள SMITH க்கு பெர்ட் உதவுகிறது. எவ்வாறாயினும், கூகிள் மற்றொரு என்.எல்.பி வழிமுறையை உருவாக்கும் வரை இது இரண்டையும் மாற்றும், பின்னர் எஸ்சிஓவில் மற்றொரு முன்னேற்றத்தை நாம் நகர்த்துவோம்.

எஸ்சிஓ ஆர்வமா? எங்கள் பிற கட்டுரைகளைப் பாருங்கள் செமால்ட் வலைப்பதிவு.