Friday 17 November 2017

Variabile Stringa Recode Nel Forex Stata


Stata per i ricercatori: lavorare con i dati Questa è la parte quarta del Stata dei ricercatori serie. Per un elenco degli argomenti trattati da questa serie, vedere l'Introduzione. Se siete nuovi a Stata consigliamo vivamente di leggere gli articoli in ordine. Ora che avete capito sintassi di base Statas, sei pronto per iniziare a lavorare con i tuoi dati. In questo articolo vi insegnerà come fare nuove variabili, modificare le variabili esistenti e creare etichette. Generare e sostituire i comandi di base per la creazione e la modifica di variabili sono generano (solitamente abbreviato gen) e sostituire (che, come altri comandi che possono distruggere le informazioni, non ha abbreviazione). gen crea nuove variabili sostituire variazioni i valori delle variabili esistenti. La loro sintassi di base è identica: gen espressione variabile sostituire espressione variabile dove variabile è il nome della variabile che si desidera creare o modificare, e di espressione è l'espressione matematica di cui si desidera mettere in esso risultato. Le espressioni possono essere semplici come un singolo numero o coinvolgere tutti i tipi di funzioni complicate. Stata ha una grande libreria di funzioni che è possibile utilizzare in generazione e sostituire espressioni, troppi per noi per coprire tutti (anche se ben introdurre alcuni come andiamo). Per un elenco completo, digitare funzioni di aiuto 8212well parlare di apprendimento dai file di aiuto a saperne di più. Se un'espressione include un valore mancante in qualsiasi punto, il risultato è mancante. Di solito questo è esattamente ciò che youd si aspettano e vogliono. Non si dovrebbe mai modificare i dati in modo interattivo, quindi prima di procedere creare un file fare. Aprire l'editor di file do (tipo doEdit o fare clic sul pulsante che assomiglia a una scrittura a matita in un notebook). clicca Immediatamente file. Salva come. e salvare il file come do data1 (Stata riempirà. do alla fine). Quindi avviare il file che fare con i seguenti comandi, come descritto nella sezione precedente: Cancella tutto log cattura vicino impostata più disconnessione utilizzando data. log, sostituire vero lavoro va qui Salva autoVersion2, sostituire log close Ora sei pronto per andare a lavorare. L'opera stessa andrà dopo l'uso di auto e prima di registro vicino. I prezzi del set di dati auto sono a 1978 dollari, quindi potrebbe essere utile per convertirli in 2015 dollari. Per fare ciò è necessario moltiplicare i prezzi per un fattore di conversione che è il CPI nel 2015 diviso per il CPI nel 1978, pari a circa 3,6. Il codice sarà: È ora possibile confrontarli con: Aggiungere queste righe al file Do, quindi fare clic sul pulsante Esegui in fondo a destra (quella che appare come foglio di carta con un simbolo po quotplayquot in un angolo) oppure premere Ctrl - d. Passare alla finestra principale di Stata per vedere i risultati. Ma consente di essere un po 'più precisa e usare 3,57 come il fattore di conversione. Torna al file fare e cambiare la linea: ed eseguire nuovamente il file fare. Il do inizio di file cancellando i dati precedenti stabiliti dalla memoria e il caricamento l'originale dal disco, quindi non c'è nessun bisogno di quotfixquot la vecchia versione di price2015. La sua semplicemente creato ancora una volta il modo in cui ora vogliamo. Avere sia un prezzo e una variabile price2015 ci ha permesso di confrontare i loro valori e verificare la plausibilità. Ma se desideri solo lavorare con 2015 dollari e sono fiducioso youve ha ottenuto il diritto formula, è possibile utilizzare il comando Sostituisci per modificare la variabile prezzo esistente invece di crearne uno nuovo: eseguire questa versione e youll ottenere il messaggio (74 veri cambiamenti fatto). Dato che l'insieme di dati ha 74 osservazioni, questo ci dice tutti loro sono stati cambiati come sposare aspettare. Una volta che si avvia tra cui se le condizioni, quante osservazioni sono state effettivamente modificate possono essere informazioni molto utili. Se un comando generazione ha una condizione if, la variabile risultante (e deve) ancora esistono per tutte le osservazioni. Tuttavia esso verrà assegnato un valore mancante per le osservazioni dove il se la condizione non è vera. Se un comando di sostituzione è una condizione if, osservazioni in cui il se la condizione non è vera verranno lasciati invariati. Si supponga di voler comprimere la scala a cinque punti della variabile Rep78 in una scala di tre punti. Aggiungere il seguente codice al file fare per farlo: gen rep31 se rep78lt3 sostituire rep32 se rep783 sostituire rep33 se rep78gt3 amp rep78lt. La prima riga crea la nuova rep3 variabile. ma imposta solo a uno per i casi in cui Rep78 è minore di tre. Gli altri vengono dispersi. La seconda linea cambia alcune di queste mancanze a due a due, e il terzo cambia più di loro a gruppi di tre. Si noti come la terza linea esclude specificamente osservazioni in cui Rep78 è mancante. Quale sarà il valore di rep3 essere per questi casi mancanti, perché non è mai impostato a qualsiasi altra cosa. Osservazioni dove Rep78 manca sono state implicitamente o esplicitamente esclusi da tutti e tre i comandi. (Se hai dimenticato di escludere i valori mancanti dall'ultimo comando, quindi rep3 sarebbero tre per le auto dove Rep78 manca, un errore fin troppo comune.) Il comando recode ti dà un modo alternativo di creare rep3. È stato progettato esclusivamente per le attività di ricodifica e è molto meno flessibile di generazione e sostituire. In realtà, nulla Recode può fare può essere fatto anche con la generazione e sostituire. in modo da imparare è facoltativo. Ma può fare alcune cose più facilmente. La sintassi è: recode var (regola 1) (regola 2) (più regole, se necessario.), Gen (newvar) L'opzione gen, alla fine non è required8212if la sua non c'è quindi la variabile originale sarà cambiato, piuttosto che la creazione di una nuova variabili con i nuovi valori. Si può anche avere un lavoro ricodifica in un elenco di variabili, tutti ricodifica nello stesso modo. Il nucleo del comando recode è una lista di regole, tra parentesi, che a spiegargli come una variabile deve essere ricodificato. Essi assumono la forma (InputValue OutputValue). La InputValue può essere un singolo numero, una lista di numeri, o un intervallo di numeri indicati con termine di partenza. OutputValue sarà sempre un unico numero. Tutto ciò che non coperta da una regola rimane invariato. Heres una versione Recode di convertire Rep78 ad una scala a tre punti: recode Rep78 (1 21) (32) (453), gen (rep3b) (L'unica ragione per la messa in vendita di 1 e 2, ma dando un range da 4 a 5 è stato quello di dimostrare entrambi gli stili) i valori mancanti richiesto alcun trattamento speciale:. in quanto mancante non è stata indicata dai valori di input di qualsiasi regola, osservazioni con valori mancanti rimangono invariati. Se avete fatto tutto correttamente, rep3 e rep3b saranno identici. Verificare che con un'asserzione: eseguire il file fare per scoprire come è fatto. Creazione di variabili indicatore Nel creare variabili indicatore, è possibile usufruire del fatto che Stata tratta vera come uno e falso come zero impostando un pari variabile a una condizione. Considerate: (. Le parentesi sono opzionali, ma rendono più facile da leggere) Questo crea una variabile indicatore chiamato gasGuzzler che è una (vera) per le auto dove mpg è inferiore a venti e zero (false) dove mpg è maggiore o uguale a venti. È possibile vedere l'effetto con: l rendere mpg se gasGuzzler Sappiamo che nessuna macchina ha un valore mancante per mpg, ma, se del caso ha fatto, il codice di cui sopra potrebbe assegnarlo uno zero per gasGuzzler come se fosse noto per avere un buon chilometraggio del gas. gasGuzzler dovrebbe mancare in questi casi, che si può fare con: gen gasGuzzler (mpglt20) se mpglt. Il comando Egen, abbreviazione di generare esteso. consente di accedere ad un altro libreria di functions8212type aiuto egen per una lista completa. funzioni Egen tendono ad essere più complesse, e spesso lavorano tra le osservazioni. Si supponga di voler trovare il valore medio di mpg e memorizzarlo in una variabile. Egen ha una funzione media che vi darà esattamente quello che vuoi: La funzione media () trova la media di una colonna. Per trovare la media di una riga, o, più probabilmente, una parte di una riga, l'uso rowmean (): Egen rmrowmean (mpg Rep78) per ogni auto, rm conterrà la media di che le auto mpg e Rep78. Non che thats probabilmente una quantità utile. Un uso più tipico di rowmean () è quello di costruire una intervistati significano risposta ad un gruppo di domande. Le funzioni Egen generalmente gestiscono i valori mancanti calcolando il loro risultato in tutto ciò che sono disponibili i dati. Così per le osservazioni in cui Rep78 è mancante, rm è solo mpg. Il più delle volte questo è ciò che si vuole: se si dispone di 10.000 osservazioni e 1 di loro ha un valore mancante si wouldnt desidera Stata a raccontarvi la sua impossibilità di calcolare una media. Tuttavia, può essere problematico: se si utilizza rowmean () per calcolare risposte medie di un gruppo di domande, ma alcune persone non ha ancora rispondere a tutte le domande, il risultato sarà lo stesso come se si fosse riempito tutti i valori mancanti con la mean8212a pessima idea. Con Egen. quanto segue il segno di uguale è una singola funzione e non un'espressione matematica. Se si volesse impostare una variabile a metà di un youd medi sono di primo utilizzo egen per calcolare la media e quindi utilizzare un comando per dividerlo per 2. sostituire Ecco alcune delle funzioni più comunemente utilizzate nella biblioteca Egen : Tutte queste funzioni agire tra le osservazioni. Le parentesi solito contengono una singola variabile per la funzione di agire, ma possono contenere un'espressione matematica invece. Queste funzioni hanno anche equivalenti fila (rowmin. Rowmax ecc.) Che fanno la stessa cosa, ma attraverso le variabili su una singola riga. Ci sono un sacco di altre funzioni EGEN utili, come std (creare una versione standardizzata di una variabile), gruppo (creare un identificatore di gruppo in base ai valori di una o più variabili categoriali), o anche MTR (aliquota marginale per una coppia di coniugi coppia in Stati Uniti con una determinata quantità di reddito in un determinato anno). È possibile ottenere un elenco completo digitando aiuto Egen. e si dovrebbe intenzione di lettura attraverso un certo tempo all'inizio della tua carriera Stata. Goccia e mantenere la goccia di comando permette di rimuovere variabili o osservazioni dai dati impostati. Se si dà una lista-variabili. rimuoverà quelle variabili: rimuove il rep3b variabile dal set di dati. Se si dà una condizione if, goccia rimuoverà tutte le osservazioni in cui tale condizione è vera: goccia se gasGuzzler La tenere comando funziona allo stesso modo, ma in senso opposto. mantenere rep3b eliminerebbe tutte le variabili tranne rep3b. mentre mantenere se gasGuzzler eliminerebbe tutte le osservazioni che non sono quelli che consumano gas. È possibile rinominare una variabile digitando: rinominare oldName newName variabili rinominandoli con nomi senza senso (H2V06 e simili) può richiedere un po 'di tempo, ma vi farà risparmiare tempo alla fine. I nomi delle variabili devono essere una parola senza spazi. Tuttavia, è possibile utilizzare sia lettere maiuscole o underscore () per segnare i confini di parola. Un nome di variabile come numinhh sembra senza senso, ma se lo metti in numInHH modulo o numinhh poi il lettore ha una possibilità di combattere di realizzare significa quotnumber in household. quot il comando Rinomina ha anche la capacità di rinominare un gran numero di variabili basate sui modelli. Digitare help rinomina per ulteriori informazioni. Il nome della variabile rep3 pretende trasmettere più informazioni, così lascia modificarlo: rinominare rep3 repairRecord Le etichette consentono di trasmettere ulteriori informazioni sui vostri dati. Basta digitare una volta, in modo che possano essere lungo quanto si desidera. Le etichette possono essere applicate alle variabili o ai loro valori (o interi set di dati, che ci voleva discutere). Questo set di dati è già un buon set di etichette delle variabili, come si può vedere nella finestra Variabili. L'unico che potrebbe essere fonte di confusione è l'etichetta su estero. così bene cambiarlo con il comando etichetta della variabile. La sintassi per impostare una etichetta variabile è: etichetta della variabile var quot etichetta labelquot quotCar estera variabile Originquot un'occhiata alla finestra Variabili di nuovo per vedere i risultati. Successivo Consente di esplorare le etichette dei valori etichettando i valori del repairRecord (precedentemente noto come rep3. La nuova variabile che ricodificato al collasso Rep78 da una scala di cinque punti a una scala a tre punti). Le etichette dei valori sono una mappatura da un insieme di numeri interi a una serie di descrizioni, in modo che il primo passo è quello di creare la mappa. Per fare ciò, utilizzare l'etichetta definire comando: etichetta definire mapName valore1 quotlabel1 quot valore2 quot label2 quot. etichetta definire rep 1 quotBadquot 2quotAveragequot 3quotGoodquot poi dire Stata per etichettare i valori della variabile repairRecord utilizzando la mappatura rep appena definito. La sintassi è: Valori etichetta mappa variabile valori delle etichette repairRecord rep Per vedere i risultati, aggiunge: Una volta che una mappa è definita si può applicare a qualsiasi numero di variabili: basta sostituire la singola variabile nei valori delle etichette comando di cui sopra con un elenco di variabili . Supponiamo che tu sei lavorare con i dati di indagine e le variabili includere il genere del convenuto, il sesso degli intervistati sposo, e generi di tutti i rispondenti bambini. Si potrebbe definire una sola mappa chiamata genere e quindi utilizzarlo per etichettare i valori di tutte le variabili di genere. Due comandi finali per le etichette dei valori: etichetta dir fornisce un elenco di tutte le etichette definite, e la lista l'etichetta ti dice che cosa significano. Tipi di variabili e di precisione Stata in grado di memorizzare i numeri in cinque diversi tipi di variabili. byte. int e long sono tutti numeri interi di varie dimensioni. Il più piccolo, di byte. in grado di memorizzare solo i numeri inferiori a 100 ma occupa poca memoria, che lo rende ideale per l'indicatore e variabili categoriali. int può memorizzare numeri fino a circa 32.000 e lunga fino a circa due miliardi. Per i numeri con le frazioni, le scelte sono galleggiante (il default) e doppio. Entrambi possono memorizzare numeri molto grandi, ma la loro precisione è limitata: un galleggiante ha solo circa sette cifre di precisione e un doppio sedici. Per ulteriori informazioni digitare help tipi di dati. Mentre gli scienziati sociali hanno raramente sette cifre significative nei loro dati, tenere a mente che gli identificatori sono solo grandi numeri per quanto Stata è interessato. Ad esempio, probabilmente pensate della vostra UW ID come una stringa di dieci piccoli interi (quotnine, pari a zero, due. Quot), ma per la sua Stata una singola, numero molto grande. Se si è tentato di archiviare gli ID UW come il galleggiante di default. theyd essere arrotondato da un negozio di sopraelevazione galleggiante dieci cifre in modo accurato (che avrebbe vanificato l'obiettivo di memorizzare un ID). Tali ID devono essere conservati con doppie. long o stringhe. Il tipo di una variabile viene impostata al momento della creazione. Per creare una variabile che non è un galleggiante, mettere il tipo desiderato subito dopo generazione o egen e prima del nome della variabile: gen byte highMPG (mpggt25) Se si dichiara che una variabile è un numero intero, ma l'espressione (byte int o lungo.) si imposta pari a contiene frazioni, verrà troncato la parte frazionaria, non arrotondati. C'è anche una funzione round () se ne avete bisogno. La maggior parte del tempo la sua non vale la pena preoccuparsi di trovare i tipi numerici più efficienti per le variabili. Tuttavia, se impostate i vostri dati è grande, utilizzando piccoli tipi come byte, ove possibile, può risparmiare un sacco di memoria e spazio su disco. Il comando impacco cercherà per le variabili che possono essere memorizzati nei tipi più piccoli senza perdere in precisione, e li cambierà automaticamente. Le stringhe sono variabili che contengono testo invece di valori numerici. È abbastanza possibile che il testo sia costituito da numeri, ma Stata non tenterà di valutarli. È possibile riconoscere una stringa perché avrà le virgolette attorno ad esso: rende x1 una stringa, ed è completamente diverso da quello, ad esempio, non puoi aggiungere x1 e x2. È possibile scrivere se x1quot123quot e anche se x1gtquot123quot ma quest'ultimo saranno valutate secondo l'ordine alfabetico, non numerico. Stata notato che si stava configurando x1 pari ad una stringa, e quindi fatto x1 una variabile stringa automaticamente. Tuttavia: non funziona perché non potete modificare una variabile da stringa numerica o vice versa8212but si può far sembrare che hai fatto. Modifica del tipo di una variabile Supponiamo che avevi bisogno di fare un po 'di matematica con i numeri contenuti in x1. In questo momento non puoi, perché x1 è una stringa. Ecco come si può cambiare la situazione: gen tempreal (x1) cadere x1 rename temperatura x1 La funzione reale () accetta un argomento, una stringa, e restituisce la stringa convertita in un numero. Se la stringa contiene nulla, ma i numeri reali () restituirà mancante. Dopo aver memorizzato i numeri x1 come temperatura. poi cadere x1 e fare temperatura del nuovo x1. x1 è ora una variabile numerica. È possibile attivare variabili numeriche in stringhe utilizzando la stessa process8212just sostituire la funzione di vero e proprio () con la funzione di stringa (). Per gli esercizi che utilizzano il set di dati automobilistica, assicurarsi che il file do carica il set di dati originali. Utilizzando il set di dati automobilistica, supponiamo che il costo di produzione di una vettura è la somma dei seguenti elementi: 1,50 per chilo di peso 0,25 per libbra per la spedizione se si tratta di stranieri 100 se la sua Rep78 è 5 (presumibilmente per assumere ingegneri migliori) Calcolare il profitto (costo meno il prezzo) dalla vendita di ogni macchina. (Soluzione) Considerare interviews. dta. Esso contiene il mese e l'anno in cui è nato ogni soggetto e il mese e l'anno in cui è stato intervistato quel soggetto. Trovare l'età del soggetto al momento del colloquio di mesi. Poi trovare in anni interi (cioè ciò che la persona avrebbe detto se lei ha chiesto quotHow vecchi sono youquot). Non preoccuparti di giorni (o, se preferite, supporre che le interviste si verificano sempre più avanti nel corso del mese di compleanni). Per il credito in più, leggere su date Stata e ripetere il processo che li utilizzano. (Soluzione) Tornando al set di dati automobile, la variabile make è composto dal costruttore della macchina seguito dal nome della vettura. Creare una nuova variabile che contiene solo il produttore. Questo esercizio probabilmente vi richiederà di digitare funzioni di aiuto Andor aiuto egen e guardare attraverso l'elenco delle funzioni disponibili. In realtà questo è il tipo di punto: trovare le funzioni che faranno ciò che è necessario fare è una parte importante della programmazione Stata. Imparare Più ha alcuni suggerimenti per comprendere i file di aiuto. (Soluzione) Consideriamo ora statecounty. dta. Ha un identificatore in due parti: lo stato e la contea. combinarle in un unico identificatore tale che County 1 nello stato 1 diventa 101 e la contea 5 in stato di 12 diventa 1205. Ora lo fanno di nuovo trasformandole in stringhe prima, rendendo il codice per contea 1, stato 1 quot0101quot. (Soluzione) Utilizzare i dati di automobili set di nuovo. Creare etichette di valore in modo che quando si elencano mpg vedete quot12 (MPG basso) quot e quot41 (più alto MPG) quot per le vetture con i valori minimo e massimo rispettivamente di mpg. (Soluzione) Ultima revisione: 12172015NOTICE: Il gruppo di consulenza statistica Idre sarà la migrazione del sito web per il CMS WordPress nel mese di febbraio per facilitare la manutenzione e la creazione di nuovi contenuti. Alcune delle nostre pagine più vecchie verranno rimossi o archiviati in modo tale che essi non saranno più mantenuti. Cercheremo di mantenere i reindirizzamenti in modo che i vecchi URL continueranno a lavorare nel miglior modo possibile. Benvenuti al Istituto per la ricerca digitale e l'istruzione Aiuto Consulting Group Stat dando un regalo Stata FAQ Come posso convertire rapidamente molte variabili stringa di variabili numeriche Ci possono essere momenti che si riceve un file che ha molte (o tutte) le variabili definita come stringhe. cioè variabili carattere. Le variabili possono contenere valori numerici, ma se sono definiti come tipo di stringa. ci sono poche cose che si possono fare per analizzare i dati. Non è possibile ottenere mezzi, non si può fare una regressione, non si può fare un ANOVA, ecc A volte l'insieme di dati contiene valori numerici che vengono memorizzati come stringhe. Affronteremo questo scenario prima. Poi si affronterà il caso in cui le variabili stringa in realtà contengono stringhe, e l'obiettivo è quello di assegnare ogni valore della stringa assume un valore numerico. Tutti gli esempi in questa pagina usano lo stesso insieme di dati, così lascia iniziare esaminando i dati. L'esempio dataset, hsbs. è un sottoinsieme della High School e Al di là file di dati con tutte le variabili come variabili stringa. Come si può vedere dal comando di descrivere qui di seguito, le variabili sono tutte definite come variabili stringa (ad esempio, la scienza è str2. Una stringa di lunghezza 2). Ora che sappiamo che le variabili sono variabili stringa, possiamo usare il comando list per vedere quali sono le stringhe memorizzate in queste variabili sembrano. Anche se la scienza variabile è definita come str2, si può vedere dal seguente elenco che contiene i valori solo numerici. Anche così, perché la variabile è definita come str2, Stata non può eseguire qualsiasi tipo di analisi numerica della scienza variabile. Lo stesso vale per la lettura variabile. Conversione variabili stringa con valori numerici Un metodo per la conversione dei numeri memorizzati come stringhe in variabili numeriche è quello di utilizzare una funzione stringa chiamata reale che traduce i valori numerici memorizzati come stringhe in valori numerici Stata in grado di riconoscere come tale. La prima linea di sintassi legge il set di dati indicato sopra. Il secondo genera una nuova readn variabile che è uguale al valore del numero memorizzato nella stringa di lettura variabile. La vera (s) è la funzione che traduce i valori detenuti come stringhe, dove s è la variabile che contiene stringhe. Un secondo metodo per ottenere lo stesso risultato è il comando destring. Consente di provare a utilizzare il comando destring e vedere come funziona. La prima riga della sintassi carica di nuovo il set di dati, in modo che stiamo iniziando con un insieme di dati che contiene ancora una volta solo le variabili stringa. La seconda linea di sintassi esegue il comando destring. Come si può vedere dal comando di descrivere qui di seguito, il comando destring convertito tutte le variabili a numerico, tranne che per la gara. genere e schtyp. Dal momento che queste variabili hanno avuto personaggi in loro, il comando destring lasciato solo tali variabili. Se ci fosse stato qualsiasi variabile numerici nel set di dati, che avrebbero rimangono invariati. Entrambe le tecniche sopra descritte hanno attributi che in alcune situazioni sono vantaggi e in altre situazioni può essere svantaggi. La destring comando può essere eseguito su un intero set di dati in un solo passaggio, il metodo utilizzando la funzione reale richiede emissione di un comando per ogni variabile da convertire (anche se questo può essere fatto con un ciclo piuttosto che digitare la sintassi per ogni variabile). Un potenziale vantaggio di utilizzare la funzione reale (il primo metodo) è che se la funzione reale rileva un valore non numerico, imposta la variabile uguale a mancare in questo caso e va avanti. In una certa misura destring può essere fatto per comportarsi in modo simile, ma non identico. Per convertire una variabile stringa che contiene qualsiasi valore non numerico utilizzando destring bisogna elencare i caratteri che devono essere ignorati (ad esempio, o.). Inoltre, piuttosto che impostare valori per i casi che contengono valori non numerici a mancare (ciò che la funzione reale fa), destring rimuove i caratteri non numerici specificati. destring estrarrà le stringhe specificate e poi convertire, il che significa che A4 può essere convertito in un comportamento 4. destring s è molto buono se uno ha i valori numerici memorizzati come stringhe che a volte contengono cose come virgole (ad esempio 4.354), ma ci possono essere situazioni in cui questo comportamento è indesiderabile. Conversione variabili stringa con i valori non numerici in valori numerici Come si fa a convertire genere e schtyp in valori numerici Possiamo usare il comando codifica come illustrato di seguito. Questi comandi creano sesso2 e schtyp2. Avviso nel comando descrivere qui di seguito che sesso2 e schtyp2 sono variabili numeriche e hanno etichette ad essi associati (chiamati sesso2 e schtyp2). Se riportiamo i dati, sembra che sesso2 e schtyp2 sono identici a genere e schtyp. tuttavia sono veramente numerici e ciò che state vedendo sono le etichette dei valori associati alle variabili. Di seguito si usa l'opzione nolabel e si vede che sesso2 e schtyp2 sono davvero numerico. Che dire della gara variabile. E 'ancora una variabile di carattere, perché il nostro comando destring prima ha visto la X nei dati e non ha cercato di convertirlo perché aveva valori non numerici. Qui di seguito possiamo convertirlo in numerico includere l'opzione di ignorare (X) che dice a destring per convertire la variabile numerica e quando incontra X per convertire che, per un valore mancante. È possibile vedere i risultati nel comando lista qui sotto. Come avete visto, possiamo usare destring per convertire le variabili stringa che contengono numeri in variabili numeriche, ed è in grado di gestire situazioni in cui alcuni valori sono memorizzati come un carattere (come la X che abbiamo visto con la razza). Se si dispone di una variabile di carattere che viene memorizzato come tutti i caratteri, è possibile utilizzare la codifica per convertire la variabile carattere a numerico e sarà creare etichette di valore che hanno i valori che sono stati memorizzati con la variabile carattere. Fore ulteriori informazioni, consultare la guida o il manuale di riferimento sui comandi destring e codificare. Il contenuto di questo sito web non deve essere interpretata come un'approvazione di un particolare sito web, il libro, o di un prodotto software dalla University of California.

No comments:

Post a Comment