Zum Inhalt springen

Unicode: "Bär" != "Bär"


Narf!

Empfohlene Beiträge

Hallo an alle,

mein Problem ist, dass zwei Strings, die augenscheinlich gleich sind es doch nicht sind.

Ich habe einen String1, der aus einer XML-Datei mit Codierung utf-8 kommt:

Halldór Laxness. Aus dem Isländischen übertragen von Ernst Harthern

Ich habe einen String2, der auch aus einem XML-Stream kommt, der laut "Hersteller" auch utf-8-Codiert ist:

Halldór Laxness. Aus d. Isländ. übers. von Ernst Harthern (hier sind z. Bsp. auch die ä-Pünktchen neben dem Buchstaben)

Wenn ich beide Strings durch CW2A(CP_UTF8) schicke erhalte ich folgendes:

String1: Halldór Laxness. Aus dem Isländischen übertragen von Ernst Harthern

String2: HalldoÃŒÂr Laxness. Aus d. Isländ. übers. von Ernst Harthern

Beides ist wohl sachlich richtig. Wie bekomme ich aber den String2 in das Format von String1, damit ich die vergleichen kann bzw. finde ich in String2 nicht String2.Find(L"Isländ.").

Genutzt wird VC++ 2010, UNICODE, MFC.

Link zu diesem Kommentar
Auf anderen Seiten teilen

So ist es. Das wollte ich auch gerade schreiben.

Angepasst aus der MSDN:


CString strText=L"Halldór Laxness. Aus d. Isländ. übers. von Ernst Harthern"


if(!IsNormalizedString(NormalizationC, strText, strText.GetLength()))

 {

  int iSizeGuess=0;

  LPWSTR pBuffer=NULL;


  // How big is our buffer (quick guess, usually enough) 

  iSizeGuess = NormalizeString(NormalizationC, strText, -1, NULL, 0);


  while(iSizeGuess > 0)

   {

    pBuffer = (LPWSTR)malloc(iSizeGuess * sizeof(WCHAR));


    if(pBuffer)

     {

      // Normalize the string 


      int iActualSize = NormalizeString(NormalizationC, strText, -1, pBuffer, iSizeGuess);

      iSizeGuess = 0;


      if (iActualSize <= 0 && GetLastError() != ERROR_SUCCESS)

       {

        // Error during normalization 

        if (GetLastError() == ERROR_INSUFFICIENT_BUFFER)

         {

          // If the buffer is too small, try again with a bigger buffer. 

          iSizeGuess = -iActualSize;

         }//end if (GetLastError() == ERROR_INSUFFICIENT_BUFFER)


        else if (GetLastError() == ERROR_NO_UNICODE_TRANSLATION)

         {

         }//end else if (GetLastError() == ERROR_NO_UNICODE_TRANSLATION)

       }//end if (iActualSize <= 0 && GetLastError() != ERROR_SUCCESS)


      else

       {

        // Display the normalized string 

       }//end else by if (iActualSize <= 0 && GetLastError() != ERROR_SUCCESS)


      strText=pBuffer;

       // Free the buffer 

      free (pBuffer);

     }//end if(pBuffer)

    else

     {

      iSizeGuess = 0;

     }//end else by if(pBuffer)

   }//end while(iSizeGuess > 0)

 }//end if(!IsNormalizedString(NormalizationC, strKurzText, strKurzText.GetLength()))


return strText;

Man erhält dann einen String, den man auch vergleichen kann.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...