2008-09-03 25 views
193

Wygenerowałem trochę JSON i próbuję przenieść go do obiektu w JavaScript. Wciąż dostaję błędy. Oto co mam:Jak obsługiwać nowe linie w JSON?

var data = '{"count" : 1, "stack" : "sometext\n\n"}'; 
var dataObj = eval('('+data+')'); 

To daje mi błąd:

unterminated string literal 

Z JSON.parse(data), widzę podobne komunikaty o błędach: "Unexpected token ↵" w Chrome i "unterminated string literal" w Firefoksie i IE.

Po usunięciu \n po błąd zniknie w obu przypadkach. Nie mogę się domyślić, dlaczego \n powoduje niepowodzenie i JSON.parse.

+7

Spróbuj użyć prawdziwego parsera json zamiast eval. – Eric

Odpowiedz

257

myślę, że to jest to, co chcesz:

var data = '{"count" : 1, "stack" : "sometext\\n\\n"}'; 

(Musisz uciec „\” w ciąg (przekształcając go w podwójnej - „\”), w przeciwnym razie stanie się on nowej linii w . źródło JSON, nie dane JSON)

+63

Jest to oczywiście poprawne, ale chciałbym dodać przyczynę tego: specyfikacja JSON pod adresem http://www.ietf.org/rfc/rfc4627.txt zawiera to zdanie w sekcji 2.5: "Wszystkie Znaki Unicode mogą być umieszczone w cudzysłowach, z wyjątkiem znaków, które muszą zostać zmienione: znak cudzysłowu, reverse solidus i znaki sterujące (od U ​​+ 0000 do U + 001F). " Ponieważ znak nowej linii jest znakiem kontrolnym, musi zostać zmieniony. –

+0

Według www.json.org JSON akceptuje sekwencję kontrolną "\ n" w łańcuchach - i jeśli spróbujesz JSON.parse (['"a \\ na"']) [1] .charCodeAt(); to pokaże 10 - co było "Linefeed", kiedy ostatnio sprawdzałem. --- BTW: Przestań krzyczeć! – BlaM

2

Możecie zajrzeć do tego C# funkcji uciec ciągu:

http://www.aspcode.net/C-encode-a-string-for-JSON-JavaScript.aspx

public static string Enquote(string s) 
{ 
    if (s == null || s.Length == 0) 
    { 
     return "\"\""; 
    } 
    char   c; 
    int   i; 
    int   len = s.Length; 
    StringBuilder sb = new StringBuilder(len + 4); 
    string  t; 

    sb.Append('"'); 
    for (i = 0; i < len; i += 1) 
    { 
     c = s[i]; 
     if ((c == '\\') || (c == '"') || (c == '>')) 
     { 
      sb.Append('\\'); 
      sb.Append(c); 
     } 
     else if (c == '\b') 
      sb.Append("\\b"); 
     else if (c == '\t') 
      sb.Append("\\t"); 
     else if (c == '\n') 
      sb.Append("\\n"); 
     else if (c == '\f') 
      sb.Append("\\f"); 
     else if (c == '\r') 
      sb.Append("\\r"); 
     else 
     { 
      if (c < ' ') 
      { 
       //t = "000" + Integer.toHexString(c); 
       string t = new string(c,1); 
       t = "000" + int.Parse(tmp,System.Globalization.NumberStyles.HexNumber); 
       sb.Append("\\u" + t.Substring(t.Length - 4)); 
      } 
      else 
      { 
       sb.Append(c); 
      } 
     } 
    } 
    sb.Append('"'); 
    return sb.ToString(); 
} 
+1

Powinieneś trochę wyczyścić ten kod ... (Nie kompiluje się). –

+2

Dlaczego to powoduje ucieczkę '>'? – nothingisnecessary

19

Musisz mieć funkcję, która zastępuje \n na \\n w przypadku, gdy data nie jest literałem ciągowym.

function jsonEscape(str) { 
    return str.replace(/\n/g, "\\\\n").replace(/\r/g, "\\\\r").replace(/\t/g, "\\\\t"); 
} 

var data = '{"count" : 1, "stack" : "sometext\n\n"}'; 
var dataObj = JSON.parse(jsonEscape(data)); 

Wynikające dataObj będzie

Object {count: 1, stack: "sometext\n\n"} 
+2

musisz uciec przed znakami ucieczki (np. '.replace (" \\ n "," \\\\ n ")') i chciałbym również zasugerować użycie wyrażenia regularnego, aby umożliwić zamianę wielu wystąpień (np. '.replace (/ \ n/g, "\\\\ n") ') – musefan

+2

dlaczego potrzebujesz ucieczki od znaków? Mam na myśli coś takiego jak '.replace (" \ n "," \\ n ")' powinno wykonać pracę dobrze !! Na przykład: "var test = [{" description ":" Jakiś opis produktu: Może to być tekst wielowierszowy. "}]; console.log (JSON.parse (test.replace (/ \ n/g, "\\ n"))); 'wypisze obiekt idealnie idealnie do konsoli przeglądarki jako' [{"description": "Niektóre opisy product. \ nTo może być tekst wielowierszowy. "}]' – Fr0zenFyr

+0

BTW, w powyższym komentarzu, oryginalny ciąg JSON ma nową linię, która jest usuwana przez formater komentarza stackoverflow. Można zobaczyć, że ostateczny wynik po zamianie powinien wstawić znak nowej linii '\ n' w wartości. – Fr0zenFyr

0

I napotkał ten problem podczas tworzenia klasy w PHP4 naśladować json_encode (dostępne w PHP5). Oto co wymyśliłem:

class jsonResponse { 
    var $response; 

    function jsonResponse() { 
     $this->response = array('isOK'=>'KO','msg'=>'Undefined'); 
    } 

    function set($isOK, $msg) { 
     $this->response['isOK'] = ($isOK) ? 'OK' : 'KO'; 
     $this->response['msg'] = htmlentities($msg); 
    } 

    function setData($data=null) { 
     if(!is_null($data)) 
      $this->response['data'] = $data; 
     elseif(isset($this->response['data'])) 
      unset($this->response['data']); 
    } 

    function send() { 
     header('Content-type: application/json'); 
     echo '{"isOK":"'.$this->response['isOK'].'","msg":'.$this->parseString($this->response['msg']); 
     if(isset($this->response['data'])) 
      echo ',"data":'.$this->parseData($this->response['data']); 
     echo '}'; 
    } 

    function parseData($data) { 
     if(is_array($data)) { 
      $parsed = array(); 
      foreach ($data as $key=>$value) 
       array_push($parsed, $this->parseString($key).':'.$this->parseData($value)); 
      return '{'.implode(',', $parsed).'}'; 
     } else 
      return $this->parseString($data); 
    } 

    function parseString($string) { 
      $string = str_replace("\\", "\\\\", $string); 
      $string = str_replace('/', "\\/", $string); 
      $string = str_replace('"', "\\".'"', $string); 
      $string = str_replace("\b", "\\b", $string); 
      $string = str_replace("\t", "\\t", $string); 
      $string = str_replace("\n", "\\n", $string); 
      $string = str_replace("\f", "\\f", $string); 
      $string = str_replace("\r", "\\r", $string); 
      $string = str_replace("\u", "\\u", $string); 
      return '"'.$string.'"'; 
    } 
} 

I przestrzegać zasady wymieniono here. Użyłem tylko tego, czego potrzebowałem, ale sądzę, że możesz dostosować go do swoich potrzeb w języku, którego używasz. Problem w moim przypadku nie dotyczył nowych linii, tak jak początkowo sądziłem, ale o tym, że nie uciekłem. Mam nadzieję, że to uniemożliwi komuś innemu ból głowy, że zrozumiałem, co zrobiłem źle.

+0

6 skrótów dla znaków kontrolnych określonych na json.org nie jest wyczerpującą listą wszystkich znaków kontrolnych. W rezultacie funkcja ta może generować nieprawidłowy JSON. – Phil

2

Hi użyłem tej funkcji rozebrać przełamane lub innych znaków w danych do analizowania JSON dane:

function normalize_str($str) { 

    $invalid = array('Š'=>'S', 'š'=>'s', 'Đ'=>'Dj', 'đ'=>'dj', 'Ž'=>'Z', 'ž'=>'z', 
    'Č'=>'C', 'č'=>'c', 'Ć'=>'C', 'ć'=>'c', 'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A', 
    'Ä'=>'A', 'Å'=>'A', 'Æ'=>'A', 'Ç'=>'C', 'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E', 
    'Ì'=>'I', 'Í'=>'I', 'Î'=>'I', 'Ï'=>'I', 'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O', 
    'Õ'=>'O', 'Ö'=>'O', 'Ø'=>'O', 'Ù'=>'U', 'Ú'=>'U', 'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y', 
    'Þ'=>'B', 'ß'=>'Ss', 'à'=>'a', 'á'=>'a', 'â'=>'a', 'ã'=>'a', 'ä'=>'a', 'å'=>'a', 
    'æ'=>'a', 'ç'=>'c', 'è'=>'e', 'é'=>'e', 'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i', 
    'î'=>'i', 'ï'=>'i', 'ð'=>'o', 'ñ'=>'n', 'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o', 
    'ö'=>'o', 'ø'=>'o', 'ù'=>'u', 'ú'=>'u', 'û'=>'u', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b', 
    'ÿ'=>'y', 'Ŕ'=>'R', 'ŕ'=>'r', "`" => "'", "´" => "'", '"' => ',', '`' => "'", 
    '´' => "'", '"' => '\"', '"' => "\"", '´' => "'", "&acirc;€™" => "'", "{" => "", 
    "~" => "", "–" => "-", "'" => "'","  " => " "); 

    $str = str_replace(array_keys($invalid), array_values($invalid), $str); 

    $remove = array("\n", "\r\n", "\r"); 
    $str = str_replace($remove, "\\n", trim($str)); 

     //$str = htmlentities($str,ENT_QUOTES); 

    return htmlspecialchars($str); 
} 


echo normalize_str($lst['address']); 
+6

W większości języków masz lepsze sposoby na usuwanie akcentów z ciągów unicode niż zapisywanie własnej funkcji mapowania. Zobacz to pytanie na przykład w python: http: // stackoverflow.com/questions/517923/what-is-the-the-best-to-remove-accents-in-a-python-unicode-string – MiniQuark

+0

ya mamy wiele sposobów kontrolowania specjalnych znaków w różnych językach. – ShivarajRH

+1

To wszystko jest złe, aby je ogólnie rozebrać. Lepiej zakodować je jako numeryczne odniesienia do znaków XML, a następnie dekodować po odebraniu. – Annarfych

2

Można po prostu uciec swój ciąg na serwerze przy pisaniu wartość pola json i unescape to kiedy pobierając na przykład wartość w przeglądarce klienta.

Implementacja javascript wszystkich głównych przeglądarek ma polecenie unescape.

Przykład: w serwerze:

response.write "{""field1"":""" & escape(RS_Temp("textField")) & """}" 

w przeglądarce:

document.getElementById("text1").value = unescape(jsonObject.field1) 
3

Według specyfikacji: http://www.ecma-international.org/publications/files/ECMA-ST/ECMA-404.pdf

A string is a sequence of Unicode code points wrapped with quotation marks 
(U+0022). All characters may be placed within the quotation marks except for the 
characters that must be escaped: quotation mark (U+0022), reverse solidus 
(U+005C), and the control characters U+0000 to U+001F. There are two-character 
escape sequence representations of some characters. 

Więc nie można przejść 0x0A lub 0x0C kody bezpośrednio. To jest zabronione! Spec sugeruje użycie sekwencji ucieczki dla niektórych ściśle określonych kodów z U+0000 do U+001F:

\f represents the form feed character (U+000C). 
\n represents the line feed character (U+000A). 

Jak większość języków programowania wykorzystuje \ do cytowania należy uciec składni ucieczki (podwójne escape - raz dla języka/platformy, raz na Json):

jsonStr = "{ \"name\": \"Multi\\nline.\" }";