Attraverso esempi in condizione di lavoro

Marzo 29, 2016 Admin Animali 0 3
FONT SIZE:
fontsize_dec
fontsize_inc

In DATEM: Volume 4, copriamo condizionamento classico e operante come le nostre due aree principali in cui operiamo tattiche nella "battaglia" con il nostro cane (e/o di comportamento).

Avevo pensato di coprire la maggior parte, ma poi ha deciso di mostrare solo alcuni dei modi che ho usato la tattica, soprattutto nel condizionamento operante, perché è lì che "vivere" la maggior parte del tempo.




Qui spiego, è anche previsto, le applicazioni che ho usato per aiutare a sviluppare Wally. Tutto qui è qualcosa che ho effettivamente utilizzato nel lavoro con Wally. Quindi questo non sarà un sacco di teoria, ma dovrebbe essere implementato come indicato nel Volume 4.

Ricordate abbreviazioni per i quattro risultati di condizionamento operante! Io sarò con loro in questo centro, ancora una volta per risparmiare spazio e familiarità. Ecco un promemoria:

  • (R +) - Il rinforzo positivo
  • (-R) - Rinforzo Negativo
  • (+ P) - Punizione positivo
  • (-P) - Punizione negativa

E un altro si vedrà:

  • (C/T) - Fare clic e trattare. Anche se non deve essere letteralmente un "click" e "trattare". Si potrebbe dire "sì" e dare un giocattolo. Potrebbe essere "buono" e hanno un gioco di tiro. Invia la mia parola/frase/Sound "carico", e quindi consegnare il premio. Ma poiché clicker e tratta sono diventati quasi "default" nel mondo + R, queste abbreviazioni sono usate spesso, quindi mi piacerebbe di acquisire familiarità con esso.

I tuoi pensieri su prime ...

Attrarre

Attirare è stato menzionato in un precedente volume. E 'un modo per guidare il cane a fare quello che ci piace il comportamento di essere senza alcun contatto fisico. Si tratta di una notevole differenza nella modellazione, approccio pratico che letteralmente.

La mancanza di processo senza contatto fisico da utilizzare per una moltitudine di comportamenti. Il primo ha mostrato questo comportamento è stato diretto naso. Ora, questo può sembrare esagerato, ma il disegno nella mia mente.

Quello che ho fatto è stato di tenere la mia mano a Wally, e quando annusò, ho cliccato e trattato (c/t). Ho preso la mia mano, e poi presentato di nuovo. Quando ha odore, c/t. Volevo essere sicuro che il suo naso era in realtà in contatto con la mano. Non riuscivo a sentire l'odore dell'aria di un piede di distanza e ottenere una ricompensa (credetemi, trovato a - il piccolo ladro). No, ho dovuto mettere un naso freddo e umido in mano.

Quindi quello che ho fatto, se lo ha fatto. Beh, ho usato uno dei due approcci. In linea di principio, vorrei utilizzare la modellazione, quindi andate lentamente la mia mano toccò il naso, poi c/t. Il comportamento contribuiscono a promuovere + R, anche se ho dovuto farlo per lui un paio di volte (e solo un paio - non voglio l'esempio mi tocca la parte posteriore della testa!) Una volta che hai il comportamento verso giù, mi chiamano (messo a lui il comando) poco prima del naso ha colpito la mia mano. Poi c/t. Una volta imparato, se ho toccato la sua mano ad un certo punto (anche "touch fantasma", dove il naso sembra toccato, ma in realtà era un centimetro di distanza), allora non ha niente. No ricompensa. No lode. Nient'altro che una buona dose di P per la sua ovvietà.

Ho anche usato per attirare insegnare la posizione verso il basso. Vorrei organizzare una festa in mio pugno e sarà odore. Così ho messo la mano sotto le gambe e scivolare all'indietro. Questo spesso ha reso a "piegare" torna in posizione abbassata. Al momento in cui è caduto, ha ricevuto una possibilità e ho aperto la mia mano per lui per ottenere il trattamento.

Come naso a punta, ho dovuto trovare altri tentativi di ottenere la ricompensa. Ha dovuto garantire che il fondo era l'unico modo che ho di premio. Un paio di errori andrebbe bene, ma troppe e io confondere i comportamenti.

Dopo essere venuto giù con facilità, direi "riposo" come era forse 2/3 fino in fondo, e quando è venuto, aveva ac/T. Se avesse fatto nulla - assolutamente nulla.

Le tattiche utilizzate:

  • (R +) - c/t per ogni comportamento di successo.
  • (-P) - Mancanza di c/t per i tentativi errati.


Shaping Shaping ...

Hot Shaping

Shaping può essere difficile per un cane. L'intero concetto di azione diretta senza chiedere può essere difficile per loro capire. Può anche essere una prova di pazienza per un allenatore come il cane cerca di capire quale sia l'obiettivo e l'allenatore può cercare solo passi nella giusta direzione e ricompensa.

Tuttavia, la conformazione utilizza un sacco di + R/P con la famiglia, che è grande perché il cane è sempre positivo in entrambe le direzioni per quanto vicino si stanno ottenendo il risultato desiderato, ed è sempre premiata attraverso qualsiasi suggerimento di progresso. Questo lo può motivare a continuare a provare e spero di lavorare con più premi.

Questo è un posto dove le barche che ho citato in un hub precedente entrano in gioco. È possibile utilizzare per contribuire a portare un bonus di + R per mostrare il cane che è stato un vero successo. I cani non capiscono che se le azioni di solito li rendono una delizia, e improvvisamente l'azione è di cinque anni, cercherà di ricordare quello che hai da offrire più cibo e di nuovo! Tuttavia, il modo migliore per realizzare un jackpot è un pezzo alla volta, ma relativamente rapida successione. Si desidera che il cane vede chiaramente ha cinque (o qualunque numero) dei premi di recitazione. Un sacco di chicche in mano potrebbe anche sembrare un sorso di dolci. Tuttavia, troppo lento e il "fattore sorpresa" è perduto. Io non voglio fare di nuovo clic dare il jackpot. Un messaggio diverso inviato a lui.

La parte più difficile della formazione inizia. L'idea di base è che il cane deve solo buttare comportamento si/un oggetto e ricompensarlo quando si esegue l'azione che stai cercando, o un passo in questa direzione. Tuttavia, in linea di principio, può essere necessario per ottenere il cane solo fare le cose senza che venga detto. Questo era chiaramente il più difficile parte Wally. Visibilmente andrebbe rapidamente panico se il + R non è riuscita. (Questo è stato il mio primo segno che P sarebbe davvero potente su di esso).

Cercando di plasmare un nuovo comportamento con questa mentalità fallirebbe, aggravando la difficoltà ad entrare. Così ho iniziato con un comportamento appreso più. Seduto era prima. Entro nella stanza e poi solo stare lì, tratta e clicker in mano. Mi guardò come "così .... cosa facciamo qui?" Ma ho ricevuto alcuna risposta. Sono stato anche una statua finché non mi ha offerto una sola seduta.

Quando si è seduti (sia come offerta o semplicemente stanco di piedi e non fare nulla), è riuscito ac/T. Il click in realtà un po 'di paura, "ma è così ottenuto il trattamento. Ho dovuto stare in piedi, e attesi di nuovo. Si sedette di nuovo. Un altro c/t. Lo ha fatto circa cinque volte, muoversi la stanza per arrivare a seguire me, e quindi offrire una sola seduta. Stavo cominciando a ottenere il blocco di esso.

Le tattiche utilizzate:

  • (+ R) - click e offrire premi per il comportamento desiderato (o qualsiasi comportamento in un primo momento).
  • (-P) - Ricompensa Retention nel tentativo di indurre uno sforzo maggiore/nuovi comportamenti.

Avanzate Shaping

Più avanti nel processo di stampaggio, vogliamo indurre la "frustrati" o "Perché diavolo non è il CLICK COMING!" risposta da lui. C'è un paio di ragioni per questo:

  1. Questo dimostra che "la zona" e si aspettano una ricompensa per comportamento offerto. Stai giocando al gioco e sistemato altro "punteggio".
  2. La frustrazione spesso porta a nuovi comportamenti, come ad esempio i tentativi di cane D'altra "push" comportamento. Siate pronti a premiare, in modo che il cane capisce lo sforzo supplementare può vincere il giorno. Stai camminando una linea sottile tra qui indurre lo stress e attivare la cessazione, la cancellazione del comportamento della sua mente!


Un esempio:

Una volta Wally imparato ad usare le gambe, cominciò a zampa me come un gatto, al fine di ottenere la c/t durante la configurazione. Dopo un po ', "lui se ho tenuto fuori e ha dato la gamba (più vicino a zero, ma ancora) ho più di un paio di volte, ho PAW ulteriormente! A volte, ha iniziato a piagnucolare un po'" o calci più veloce e frenetico. Questa è la reazione di cui sto parlando.

Ma allora io resto fuori. Ciò che rende questo momento? Ha messo entrambi i piedi a me. Così un altro c/t. Ho tenuto fuori su tutto questo, e poi in piedi sulla zampe posteriori e schiaffeggiato le zampe sulla mia gamba. Avere un clic e un premio per questo.

Il jackpot era lì. Quando altre delizie sono stati i seguenti, ha cominciato ad abbaiare. Non ha mai abbaiato in piedi come prima. Ho un altro clic e un jackpot di questo sforzo!

Sidenote: Tactics miscela operativo

Ci sono quattro aspetti di condizionamento operante solo per essere utilizzati singolarmente. Essi possono essere mescolati insieme in un esercizio o un'attività e sono generalmente considerati il ​​più efficace quando usato in questo modo.

Vi sono alcune combinazioni comuni.

  • + R/P: Questo accoppiamento combina l'uso di una carica di parola/suono e una ricompensa in relazione al rifiuto della consegna ricompensa. Questo dà al cane un sì/no tipo di componente di apprendimento in cui il cane può fare qualcosa per rendere le cose, gli altri il medesimo la perdita.
  • -R/+ P: Questa coppia è orientato intorno avere il cane evitare spiacevoli applicato per imparare che cosa fare. Il premio in questo caso è la fine di un evento che non ti piace, o prendere un comportamento al fine di evitare il verificarsi di un evento di dispiacere.

Questi sono comunemente visto e probabilmente saranno utilizzati e che si incontrano nel centro di molte discussioni, consulenza e formazione.

Spesso gli allenatori con cui saranno raggruppate l'uso positivo. Stress "Coaching positivo" + R. "correzione Trainers" sottolineano + P.

Tuttavia, queste etichette creano miti, e come tali, sono inutili.

Non esiste una cosa come la formazione effettiva del 100% viene eseguita + R. Il premio istante, che è -P. Periodo. Non vi è 100% o metodo + P. sarebbe l'attuazione di una avversione per tutto ciò che il cane ha fatto.

Premiare tutto ciò che un cane non insegna nulla. Punire tutto ciò che non ha neanche. In quanto tale, non davvero descrivere o un sottoinsieme di coach.

Allenatori "bilanciati"

Il tentativo di classificare allenatori tira l'altra categoria chiamata allenatore "equilibrato". Ciò significa che il formatore tenderà a favorire + R/-R o -P/P +, ma anche un altro metodo di miscelazione in "conflitto" con l'accoppiamento. Ad esempio, un "Coach Positive" usando repulsivo, anche se il rifiuto del premio non ottiene il punto attraverso. Questo potrebbe essere indicato come + R/P/+ P. Analogamente, una "correzione guida" che dà un grezzo, una volta che il cane è tornato in posizione ottimale può essere chiamato un R/P +/+ allenatore R.

Naturalmente, potete mescolare ogni modo possibile e con tutti i "regole" la notazione che si desidera. Io li elenco come allenatore dà la priorità, poi questi altri approcci, se necessario. Vorrei scrivere a me stesso come essere + R/P/R

Il fatto che questi possono essere mescolati e abbinati in un buon paio di combinazioni rende tutte queste etichette in gran parte privo di senso per me. Io preferisco chiedere (o che vedo o leggo) come l'allenatore con il suo/il suo cane (s) e vedere come le cose si incastrano nel suo complesso e che si avvicina lui/lei usa. Una volta che sapete che cosa i quattro quadranti sono e dire, si può fare la propria analisi sulla base di ciò che l'individuo allenatore.

Modeling

Indubbiamente, questo è un metodo che sto usando di meno, però, è quello che io uso e ha avuto un certo successo con. In quanto tale, non mi butto via, se potesse tornare utile a volte.

Come accennato in precedenza, il modello è fisicamente manipolare il cane a "mostrare come" fare qualcosa. Poi, una volta completato, di consegnare il c/t.

Uno dei trucchi più difficili per Wally per imparare era a tremare. Mescolare spesso significa che il cane sarà estendere la gamba e tenerlo lì in modo da poter prendere e "stringere la mano" con lui. Wally ha fatto due cose - prendere le cose e usare le gambe. Modeling ha aiutato la situazione della gamba.

Ho dovuto sedersi di fronte a me. Ho avuto il mio clicker e tratta pronto. Poi il solletico la parte posteriore della gamba. Questo ha finito per essere la chiave. L'altro approccio di modellazione è stato quello di prendere e tenere la sua zampa in mano, alzare e dire "shake", poi c/t. ... Che non ha funzionato. In tutto.

Solletico la parte posteriore della gamba -...! Che deve spostare la gamba un po '"Ho tenuto questo Presto, ha preso la gamba da terra che era tutto C/T per lui ora è come, beh ... successo qui. Ha messo il piede giù, e ancora non. Tickle, solletico, solletico! E 'come grrr qui è di nuovo! zampa è alzato. Un altro c/t. Ho potuto vedere le ruote girare, e quello che è successo allora è una lezione di movimenti del corpo sempre sempre CONSIDERATE, perché il vostro cane è sempre guardando il vostro corpo.

Ho spostato la mia mano verso il basso - e cominciai la prima tappa è il sollevamento mia mano è venuto. Jackpot Tempo Wally! L'ho fatto di nuovo, e, naturalmente, la gamba caduto. Ho messo subito la mano sotto la gamba, quando stava per muoversi verso il basso, e fare clic e provato. Quindi aggiungere un segno "Zampa" appena prima ho spostato la mia mano verso il basso. Sollevò la gamba, e si c/t.

In realtà, ci sono stati un paio di cose al lavoro qui che la modellazione solo direttamente. In un primo momento è stato, ma in modo strano (solletico). Poi è diventato un po 'di formatura (che offrono quando la mano va alla gamba) e allo stesso tempo ha dato un segnale di mano costruzione che funziona ancora. Se la mia mano è vicino a una gamba, ha messo il piede in mano. Avrebbe potuto essere un po '-R succedendo qui con il solletico. Niente duro, ma ovviamente fatto scomodo e che, per definizione, fa -R. Sollevò la gamba elimina la sensazione di solletico. Il comportamento che ha una ricompensa (+ R), così che cosa ha spinto ripetuto anche senza il solletico.

Le tattiche utilizzate:

  • (-R) - Il formicolio era scomodo per lui, e lo portò a sollevare la gamba per farlo smettere.
  • (+ R) - Il click che si è verificato durante la gamba sollevarlo ha detto che "ha fatto la cosa giusta" e ha ricevuto una ricompensa. Ora, elevazione della gamba è un comportamento ripetuto.

Come si insegna?

Questo è tutto tattica, I Guess

Sembra che ci sia molto di più di andare, a meno che qualcuno può pensare a cose che ho perso o bisogno di rivisitare.

Nel frattempo, il volume successivo riguarderà un argomento diverso. Vediamo allora.

alcuni link come questo viaggio

  • Parte 1 spiega la formazione di addestrare il vostro cane per accendere un interruttore della luce
    Parte di una serie di video in cui un cane è come colpire un interruttore.
  • Daily Star Dog - Lure/Reward Training
    Dr. Dunbar Guida per l'addestramento del cane lure/ricompensa
  • Come Shaping sviluppa Learning | Karen Pryor Clickertraining
    Sessioni gratuiti definizione ci danno una finestra sul processo di pensiero degli studenti. Possiamo vedere come gli studenti a prendere decisioni per trovare soluzioni, e possiamo vedere quando siete a corto di idee.

(0)
(0)

Commenti - 0

Non ci sono commenti

Aggiungi un commento

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Caratteri rimanenti: 3000
captcha