Whamcloud - gitweb
Augment ->do_{read,write}_lock() prototypes with a `role' parameter indicating
[fs/lustre-release.git] / lustre / mdd / mdd_lov.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * GPL HEADER START
5  *
6  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License version 2 only,
10  * as published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * General Public License version 2 for more details (a copy is included
16  * in the LICENSE file that accompanied this code).
17  *
18  * You should have received a copy of the GNU General Public License
19  * version 2 along with this program; If not, see
20  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
21  *
22  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
23  * CA 95054 USA or visit www.sun.com if you need additional information or
24  * have any questions.
25  *
26  * GPL HEADER END
27  */
28 /*
29  * Copyright  2008 Sun Microsystems, Inc. All rights reserved
30  * Use is subject to license terms.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/mdd/mdd_lov.c
37  *
38  * Lustre Metadata Server (mds) handling of striped file data
39  *
40  * Author: Peter Braam <braam@clusterfs.com>
41  * Author: wangdi <wangdi@clusterfs.com>
42  */
43
44 #ifndef EXPORT_SYMTAB
45 # define EXPORT_SYMTAB
46 #endif
47 #define DEBUG_SUBSYSTEM S_MDS
48
49 #include <linux/module.h>
50 #include <obd.h>
51 #include <obd_class.h>
52 #include <lustre_ver.h>
53 #include <obd_support.h>
54 #include <obd_lov.h>
55 #include <lprocfs_status.h>
56 #include <lustre_mds.h>
57 #include <lustre_fid.h>
58 #include <lustre/lustre_idl.h>
59
60 #include "mdd_internal.h"
61
62 static int mdd_notify(struct obd_device *host, struct obd_device *watched,
63                       enum obd_notify_event ev, void *owner)
64 {
65         struct mdd_device *mdd = owner;
66         int rc = 0;
67         ENTRY;
68
69         LASSERT(owner != NULL);
70         switch (ev)
71         {
72                 case OBD_NOTIFY_ACTIVE:
73                 case OBD_NOTIFY_SYNC:
74                 case OBD_NOTIFY_SYNC_NONBLOCK:
75                         rc = md_do_upcall(NULL, &mdd->mdd_md_dev, MD_LOV_SYNC);
76                         break;
77                 case OBD_NOTIFY_CONFIG:
78                         rc = md_do_upcall(NULL, &mdd->mdd_md_dev, MD_LOV_CONFIG);
79                         break;
80                 default:
81                         CDEBUG(D_INFO, "Unhandled notification %#x\n", ev);
82         }
83
84         RETURN(rc);
85 }
86
87 /* The obd is created for handling data stack for mdd */
88 int mdd_init_obd(const struct lu_env *env, struct mdd_device *mdd,
89                  struct lustre_cfg *cfg)
90 {
91         char                   *dev = lustre_cfg_string(cfg, 0);
92         int                     rc, name_size, uuid_size;
93         char                   *name, *uuid;
94         __u32                   mds_id;
95         struct lustre_cfg_bufs *bufs;
96         struct lustre_cfg      *lcfg;
97         struct obd_device      *obd;
98         ENTRY;
99
100         mds_id = mdd2lu_dev(mdd)->ld_site->ls_node_id;
101         name_size = strlen(MDD_OBD_NAME) + 35;
102         uuid_size = strlen(MDD_OBD_UUID) + 35;
103
104         OBD_ALLOC(name, name_size);
105         OBD_ALLOC(uuid, uuid_size);
106         if (name == NULL || uuid == NULL)
107                 GOTO(cleanup_mem, rc = -ENOMEM);
108
109         OBD_ALLOC_PTR(bufs);
110         if (!bufs)
111                 GOTO(cleanup_mem, rc = -ENOMEM);
112
113         snprintf(name, strlen(MDD_OBD_NAME) + 35, "%s-%s-%d",
114                  MDD_OBD_NAME, dev, mds_id);
115
116         snprintf(uuid, strlen(MDD_OBD_UUID) + 35, "%s-%s-%d",
117                  MDD_OBD_UUID, dev, mds_id);
118
119         lustre_cfg_bufs_reset(bufs, name);
120         lustre_cfg_bufs_set_string(bufs, 1, MDD_OBD_TYPE);
121         lustre_cfg_bufs_set_string(bufs, 2, uuid);
122         lustre_cfg_bufs_set_string(bufs, 3, (char*)dev/* MDD_OBD_PROFILE */);
123         lustre_cfg_bufs_set_string(bufs, 4, (char*)dev);
124
125         lcfg = lustre_cfg_new(LCFG_ATTACH, bufs);
126         OBD_FREE_PTR(bufs);
127         if (!lcfg)
128                 GOTO(cleanup_mem, rc = -ENOMEM);
129
130         rc = class_attach(lcfg);
131         if (rc)
132                 GOTO(lcfg_cleanup, rc);
133
134         obd = class_name2obd(name);
135         if (!obd) {
136                 CERROR("Can not find obd %s\n", MDD_OBD_NAME);
137                 LBUG();
138         }
139
140         obd->obd_recovering = 1;
141         obd->u.mds.mds_id = mds_id;
142         rc = class_setup(obd, lcfg);
143         if (rc)
144                 GOTO(class_detach, rc);
145
146         /*
147          * Add here for obd notify mechanism, when adding a new ost, the mds
148          * will notify this mdd.
149          */
150         obd->obd_upcall.onu_upcall = mdd_notify;
151         obd->obd_upcall.onu_owner = mdd;
152         mdd->mdd_obd_dev = obd;
153
154         EXIT;
155 class_detach:
156         if (rc)
157                 class_detach(obd, lcfg);
158 lcfg_cleanup:
159         lustre_cfg_free(lcfg);
160 cleanup_mem:
161         if (name)
162                 OBD_FREE(name, name_size);
163         if (uuid)
164                 OBD_FREE(uuid, uuid_size);
165         return rc;
166 }
167
168 int mdd_fini_obd(const struct lu_env *env, struct mdd_device *mdd,
169                  struct lustre_cfg *lcfg)
170 {
171         struct obd_device      *obd;
172         int rc;
173         ENTRY;
174
175         obd = mdd2obd_dev(mdd);
176         LASSERT(obd);
177
178         rc = class_cleanup(obd, lcfg);
179         if (rc)
180                 GOTO(lcfg_cleanup, rc);
181
182         obd->obd_upcall.onu_upcall = NULL;
183         obd->obd_upcall.onu_owner = NULL;
184         rc = class_detach(obd, lcfg);
185         if (rc)
186                 GOTO(lcfg_cleanup, rc);
187         mdd->mdd_obd_dev = NULL;
188         
189         EXIT;
190 lcfg_cleanup:
191         return rc;
192 }
193
194 int mdd_get_md(const struct lu_env *env, struct mdd_object *obj,
195                void *md, int *md_size, const char *name)
196 {
197         int rc;
198         ENTRY;
199
200         rc = mdo_xattr_get(env, obj, mdd_buf_get(env, md, *md_size), name,
201                            mdd_object_capa(env, obj));
202         /*
203          * XXX: Handling of -ENODATA, the right way is to have ->do_md_get()
204          * exported by dt layer.
205          */
206         if (rc == 0 || rc == -ENODATA) {
207                 *md_size = 0;
208                 rc = 0;
209         } else if (rc < 0) {
210                 CERROR("Error %d reading eadata \n", rc);
211         } else {
212                 /* XXX: Convert lov EA but fixed after verification test. */
213                 *md_size = rc;
214         }
215
216         RETURN(rc);
217 }
218
219 int mdd_get_md_locked(const struct lu_env *env, struct mdd_object *obj,
220                       void *md, int *md_size, const char *name)
221 {
222         int rc = 0;
223         mdd_read_lock(env, obj, MOR_TGT_CHILD);
224         rc = mdd_get_md(env, obj, md, md_size, name);
225         mdd_read_unlock(env, obj);
226         return rc;
227 }
228
229 static int mdd_lov_set_stripe_md(const struct lu_env *env,
230                                  struct mdd_object *obj, struct lu_buf *buf,
231                                  struct thandle *handle)
232 {
233         struct mdd_device       *mdd = mdo2mdd(&obj->mod_obj);
234         struct obd_device       *obd = mdd2obd_dev(mdd);
235         struct obd_export       *lov_exp = obd->u.mds.mds_osc_exp;
236         struct lov_stripe_md    *lsm = NULL;
237         int rc;
238         ENTRY;
239
240         LASSERT(S_ISDIR(mdd_object_type(obj)) || S_ISREG(mdd_object_type(obj)));
241         rc = obd_iocontrol(OBD_IOC_LOV_SETSTRIPE, lov_exp, 0,
242                            &lsm, buf->lb_buf);
243         if (rc)
244                 RETURN(rc);
245         obd_free_memmd(lov_exp, &lsm);
246
247         rc = mdd_xattr_set_txn(env, obj, buf, MDS_LOV_MD_NAME, 0, handle);
248
249         CDEBUG(D_INFO, "set lov ea of "DFID" rc %d \n", PFID(mdo2fid(obj)), rc);
250         RETURN(rc);
251 }
252
253 /*
254  * Permission check is done before call it,
255  * no need check again.
256  */
257 static int mdd_lov_set_dir_md(const struct lu_env *env,
258                               struct mdd_object *obj, struct lu_buf *buf,
259                               struct thandle *handle)
260 {
261         struct lov_user_md *lum = NULL;
262         int rc = 0;
263         ENTRY;
264
265         LASSERT(S_ISDIR(mdd_object_type(obj)));
266         lum = (struct lov_user_md*)buf->lb_buf;
267
268         /* if { size, offset, count } = { 0, -1, 0 } and no pool (i.e. all default
269          * values specified) then delete default striping from dir. */
270         if (lum->lmm_stripe_size == 0 && lum->lmm_stripe_count == 0 &&
271             lum->lmm_stripe_offset == (typeof(lum->lmm_stripe_offset))(-1) &&
272             lum->lmm_magic != LOV_USER_MAGIC_V3) {
273                 rc = mdd_xattr_set_txn(env, obj, &LU_BUF_NULL,
274                                        MDS_LOV_MD_NAME, 0, handle);
275                 if (rc == -ENODATA)
276                         rc = 0;
277                 CDEBUG(D_INFO, "delete lov ea of "DFID" rc %d \n",
278                                 PFID(mdo2fid(obj)), rc);
279         } else {
280                 rc = mdd_lov_set_stripe_md(env, obj, buf, handle);
281         }
282         RETURN(rc);
283 }
284
285 int mdd_lsm_sanity_check(const struct lu_env *env,  struct mdd_object *obj)
286 {
287         struct lu_attr   *tmp_la = &mdd_env_info(env)->mti_la;
288         struct md_ucred  *uc     = md_ucred(env);
289         int rc;
290         ENTRY;
291
292         rc = mdd_la_get(env, obj, tmp_la, BYPASS_CAPA);
293         if (rc)
294                 RETURN(rc);
295
296         if ((uc->mu_fsuid != tmp_la->la_uid) &&
297             !mdd_capable(uc, CFS_CAP_FOWNER))
298                 rc = mdd_permission_internal_locked(env, obj, tmp_la,
299                                                     MAY_WRITE, MOR_TGT_CHILD);
300
301         RETURN(rc);
302 }
303
304 int mdd_lov_set_md(const struct lu_env *env, struct mdd_object *pobj,
305                    struct mdd_object *child, struct lov_mds_md *lmmp,
306                    int lmm_size, struct thandle *handle, int set_stripe)
307 {
308         struct lu_buf *buf;
309         umode_t mode;
310         int rc = 0;
311         ENTRY;
312
313         buf = mdd_buf_get(env, lmmp, lmm_size);
314         mode = mdd_object_type(child);
315         if (S_ISREG(mode) && lmm_size > 0) {
316                 if (set_stripe) {
317                         rc = mdd_lov_set_stripe_md(env, child, buf, handle);
318                 } else {
319                         rc = mdd_xattr_set_txn(env, child, buf,
320                                                MDS_LOV_MD_NAME, 0, handle);
321                 }
322         } else if (S_ISDIR(mode)) {
323                 if (lmmp == NULL && lmm_size == 0) {
324                         struct mdd_device *mdd = mdd_obj2mdd_dev(child);
325                         struct lov_mds_md *lmm = mdd_max_lmm_get(env, mdd);
326                         int size = sizeof(struct lov_mds_md_v3);
327
328                         /* Get parent dir stripe and set */
329                         if (pobj != NULL)
330                                 rc = mdd_get_md_locked(env, pobj, lmm, &size,
331                                                        MDS_LOV_MD_NAME);
332                         if (rc > 0) {
333                                 buf = mdd_buf_get(env, lmm, size);
334                                 rc = mdd_xattr_set_txn(env, child, buf,
335                                                MDS_LOV_MD_NAME, 0, handle);
336                                 if (rc)
337                                         CERROR("error on copy stripe info: rc "
338                                                 "= %d\n", rc);
339                         }
340                 } else {
341                         LASSERT(lmmp != NULL && lmm_size > 0);
342                         rc = mdd_lov_set_dir_md(env, child, buf, handle);
343                 }
344         }
345         CDEBUG(D_INFO, "Set lov md %p size %d for fid "DFID" rc %d\n",
346                         lmmp, lmm_size, PFID(mdo2fid(child)), rc);
347         RETURN(rc);
348 }
349
350 /*
351  * XXX: this is for create lsm object id, which should identify the lsm object
352  * unique in the whole mds, as I see. But it seems, we still not need it
353  * now. Right? So just borrow the ll_fid_build_ino().
354  */
355 static obd_id mdd_lov_create_id(const struct lu_fid *fid)
356 {
357         return fid_flatten(fid);
358 }
359
360 static void mdd_lov_update_objids(struct obd_device *obd, struct lov_mds_md *lmm)
361 {
362         struct mds_obd *mds = &obd->u.mds;
363         int j;
364         struct lov_ost_data_v1 *lmm_objects;
365         ENTRY;
366
367         /* if we create file without objects - lmm is NULL */
368         if (lmm == NULL)
369                 return;
370
371         if (le32_to_cpu(lmm->lmm_magic) == LOV_MAGIC_V3)
372                 lmm_objects = ((struct lov_mds_md_v3 *)lmm)->lmm_objects;
373         else
374                 lmm_objects = lmm->lmm_objects;
375
376         for (j = 0; j < le32_to_cpu(lmm->lmm_stripe_count); j++) {
377                 int i = le32_to_cpu(lmm_objects[j].l_ost_idx);
378                 obd_id id = le64_to_cpu(lmm_objects[j].l_object_id);
379                 int page = i / OBJID_PER_PAGE();
380                 int idx = i % OBJID_PER_PAGE();
381                 obd_id *data = mds->mds_lov_page_array[page];
382
383                 CDEBUG(D_INODE,"update last object for ost %d - new %llu"
384                                " old %llu\n", i, id, data[idx]);
385                 if (id > data[idx]) {
386                         data[idx] = id;
387                         cfs_bitmap_set(mds->mds_lov_page_dirty, page);
388                 }
389         }
390         EXIT;
391 }
392
393 void mdd_lov_objid_update(struct mdd_device *mdd, struct lov_mds_md *lmm)
394 {
395         mdd_lov_update_objids(mdd->mdd_obd_dev, lmm);
396 }
397
398 void mdd_lov_create_finish(const struct lu_env *env, struct mdd_device *mdd,
399                            struct lov_mds_md *lmm, int lmm_size,
400                            const struct md_op_spec *spec)
401 {
402         if (lmm && !spec->u.sp_ea.no_lov_create)
403                 OBD_FREE(lmm, lmm_size);
404 }
405
406 int mdd_lov_create(const struct lu_env *env, struct mdd_device *mdd,
407                    struct mdd_object *parent, struct mdd_object *child,
408                    struct lov_mds_md **lmm, int *lmm_size,
409                    const struct md_op_spec *spec, struct lu_attr *la)
410 {
411         struct obd_device     *obd = mdd2obd_dev(mdd);
412         struct obd_export     *lov_exp = obd->u.mds.mds_osc_exp;
413         struct obdo           *oa;
414         struct lov_stripe_md  *lsm = NULL;
415         const void            *eadata = spec->u.sp_ea.eadata;
416         __u32                  create_flags = spec->sp_cr_flags;
417         struct obd_trans_info *oti = &mdd_env_info(env)->mti_oti;
418         int                    rc = 0;
419         ENTRY;
420
421         if (!md_should_create(create_flags))
422                 RETURN(0);
423
424         oti_init(oti, NULL);
425
426         /* replay case, has objects already, only get lov from eadata */
427         if (spec->u.sp_ea.no_lov_create != 0) {
428                 *lmm = (struct lov_mds_md *)spec->u.sp_ea.eadata;
429                 *lmm_size = spec->u.sp_ea.eadatalen;
430                 RETURN(0);
431         }
432
433         if (OBD_FAIL_CHECK(OBD_FAIL_MDS_ALLOC_OBDO))
434                 GOTO(out_ids, rc = -ENOMEM);
435
436         LASSERT(lov_exp != NULL);
437         oa = &mdd_env_info(env)->mti_oa;
438
439         oa->o_uid = 0; /* must have 0 uid / gid on OST */
440         oa->o_gid = 0;
441         oa->o_gr = FILTER_GROUP_MDS0 + mdd2lu_dev(mdd)->ld_site->ls_node_id;
442         oa->o_mode = S_IFREG | 0600;
443         oa->o_id = mdd_lov_create_id(mdd_object_fid(child));
444         oa->o_valid = OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLFLAGS |
445                 OBD_MD_FLMODE | OBD_MD_FLUID | OBD_MD_FLGID | OBD_MD_FLGROUP;
446         oa->o_size = 0;
447
448         if (!(create_flags & MDS_OPEN_HAS_OBJS)) {
449                 if (create_flags & MDS_OPEN_HAS_EA) {
450                         LASSERT(eadata != NULL);
451                         rc = obd_iocontrol(OBD_IOC_LOV_SETSTRIPE, lov_exp,
452                                            0, &lsm, (void*)eadata);
453                         if (rc)
454                                 GOTO(out_oti, rc);
455                         lsm->lsm_object_id = oa->o_id;
456                         lsm->lsm_object_gr = oa->o_gr;
457                 } else if (parent != NULL) {
458                         /* get lov ea from parent and set to lov */
459                         struct lov_mds_md *_lmm;
460                         int _lmm_size;
461
462                         _lmm_size = mdd_lov_mdsize(env, mdd);
463                         _lmm = mdd_max_lmm_get(env, mdd);
464
465                         if (_lmm == NULL)
466                                 GOTO(out_oti, rc = -ENOMEM);
467
468                         rc = mdd_get_md_locked(env, parent, _lmm,
469                                                &_lmm_size,
470                                                MDS_LOV_MD_NAME);
471                         if (rc > 0)
472                                 rc = obd_iocontrol(OBD_IOC_LOV_SETSTRIPE,
473                                                    lov_exp, 0, &lsm, _lmm);
474                         if (rc)
475                                 GOTO(out_oti, rc);
476                 }
477
478                 rc = obd_create(lov_exp, oa, &lsm, oti);
479                 if (rc) {
480                         if (rc > 0) {
481                                 CERROR("Create error for "DFID": %d\n",
482                                        PFID(mdo2fid(child)), rc);
483                                 rc = -EIO;
484                         }
485                         GOTO(out_oti, rc);
486                 }
487                 LASSERT(lsm->lsm_object_gr >= FILTER_GROUP_MDS0);
488         } else {
489                 LASSERT(eadata != NULL);
490                 rc = obd_iocontrol(OBD_IOC_LOV_SETEA, lov_exp, 0, &lsm,
491                                    (void*)eadata);
492                 if (rc)
493                         GOTO(out_oti, rc);
494                 lsm->lsm_object_id = oa->o_id;
495                 lsm->lsm_object_gr = oa->o_gr;
496         }
497
498         /*
499          * Sometimes, we may truncate some object(without lsm) then open it
500          * (with write flags), so creating lsm above.  The Nonzero(truncated)
501          * size should tell ost, since size attr is in charge by OST.
502          */
503         if (la->la_size && la->la_valid & LA_SIZE) {
504                 struct obd_info *oinfo = &mdd_env_info(env)->mti_oi;
505
506                 memset(oinfo, 0, sizeof(*oinfo));
507
508                 /* When setting attr to ost, FLBKSZ is not needed. */
509                 oa->o_valid &= ~OBD_MD_FLBLKSZ;
510                 obdo_from_la(oa, la, OBD_MD_FLTYPE | OBD_MD_FLATIME |
511                              OBD_MD_FLMTIME | OBD_MD_FLCTIME | OBD_MD_FLSIZE);
512
513                 /*
514                  * XXX: Pack lustre id to OST, in OST, it will be packed by
515                  * filter_fid, but can not see what is the usages. So just pack
516                  * o_seq o_ver here, maybe fix it after this cycle.
517                  */
518                 oa->o_fid = fid_seq(mdd_object_fid(child));
519                 oa->o_generation = fid_oid(mdd_object_fid(child));
520                 oa->o_valid |= OBD_MD_FLFID | OBD_MD_FLGENER;
521                 oinfo->oi_oa = oa;
522                 oinfo->oi_md = lsm;
523                 oinfo->oi_capa = mdo_capa_get(env, child, NULL,
524                                               CAPA_OPC_MDS_DEFAULT);
525                 oinfo->oi_policy.l_extent.start = la->la_size;
526                 oinfo->oi_policy.l_extent.end = OBD_OBJECT_EOF;
527
528                 if (IS_ERR(oinfo->oi_capa))
529                         oinfo->oi_capa = NULL;
530
531                 rc = obd_punch_rqset(lov_exp, oinfo, oti);
532                 capa_put(oinfo->oi_capa);
533                 if (rc) {
534                         CERROR("Error setting attrs for "DFID": rc %d\n",
535                                PFID(mdo2fid(child)), rc);
536                         if (rc > 0) {
537                                 CERROR("obd_setattr for "DFID" rc %d\n",
538                                         PFID(mdo2fid(child)), rc);
539                                 rc = -EIO;
540                         }
541                         GOTO(out_oti, rc);
542                 }
543         }
544
545         /* blksize should be changed after create data object */
546         la->la_valid |= LA_BLKSIZE;
547         la->la_blksize = oa->o_blksize;
548         *lmm = NULL;
549         rc = obd_packmd(lov_exp, lmm, lsm);
550         if (rc < 0) {
551                 CERROR("Cannot pack lsm, err = %d\n", rc);
552                 GOTO(out_oti, rc);
553         }
554         *lmm_size = rc;
555         rc = 0;
556         EXIT;
557 out_oti:
558         oti_free_cookies(oti);
559 out_ids:
560         if (lsm)
561                 obd_free_memmd(lov_exp, &lsm);
562
563         return rc;
564 }
565
566 /*
567  * used when destroying orphans and from mds_reint_unlink() when MDS wants to
568  * destroy objects on OSS.
569  */
570 static
571 int mdd_lovobj_unlink(const struct lu_env *env, struct mdd_device *mdd,
572                       struct mdd_object *obj, struct lu_attr *la,
573                       struct lov_mds_md *lmm, int lmm_size,
574                       struct llog_cookie *logcookies,
575                       int log_unlink)
576 {
577         struct obd_device     *obd = mdd2obd_dev(mdd);
578         struct obd_export     *lov_exp = obd->u.mds.mds_osc_exp;
579         struct lov_stripe_md  *lsm = NULL;
580         struct obd_trans_info *oti = &mdd_env_info(env)->mti_oti;
581         struct obdo           *oa = &mdd_env_info(env)->mti_oa;
582         int rc;
583         ENTRY;
584
585         if (lmm_size == 0)
586                 RETURN(0);
587
588         rc = obd_unpackmd(lov_exp, &lsm, lmm, lmm_size);
589         if (rc < 0) {
590                 CERROR("Error unpack md %p\n", lmm);
591                 RETURN(rc);
592         } else {
593                 LASSERT(rc >= sizeof(*lsm));
594                 rc = 0;
595         }
596
597         oa->o_id = lsm->lsm_object_id;
598         oa->o_gr = FILTER_GROUP_MDS0 + mdd2lu_dev(mdd)->ld_site->ls_node_id;
599         oa->o_mode = la->la_mode & S_IFMT;
600         oa->o_valid = OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLGROUP;
601
602         oti_init(oti, NULL);
603         if (log_unlink && logcookies) {
604                 oa->o_valid |= OBD_MD_FLCOOKIE;
605                 oti->oti_logcookies = logcookies;
606         }
607
608         CDEBUG(D_INFO, "destroying OSS object %d/%d\n",
609                         (int)oa->o_id, (int)oa->o_gr);
610
611         rc = obd_destroy(lov_exp, oa, lsm, oti, NULL);
612
613         obd_free_memmd(lov_exp, &lsm);
614         RETURN(rc);
615 }
616
617
618 /*
619  * called with obj not locked. 
620  */
621 int mdd_lov_destroy(const struct lu_env *env, struct mdd_device *mdd,
622                     struct mdd_object *obj, struct lu_attr *la)
623 {
624         struct md_attr    *ma = &mdd_env_info(env)->mti_ma;
625         int                rc;
626         ENTRY;
627
628         if (unlikely(la->la_nlink != 0)) {
629                 CWARN("Attempt to destroy OSS object when nlink == %d\n",
630                       la->la_nlink);
631                 RETURN(0);
632         }
633
634         ma->ma_lmm_size = mdd_lov_mdsize(env, mdd);
635         ma->ma_lmm = mdd_max_lmm_get(env, mdd);
636         ma->ma_cookie_size = mdd_lov_cookiesize(env, mdd);
637         ma->ma_cookie = mdd_max_cookie_get(env, mdd);
638         if (ma->ma_lmm == NULL || ma->ma_cookie == NULL)
639                 RETURN(rc = -ENOMEM);
640
641         /* get lov ea */
642         rc = mdd_get_md_locked(env, obj, ma->ma_lmm, &ma->ma_lmm_size,
643                                MDS_LOV_MD_NAME);
644         if (rc) {
645                 CWARN("Get lov ea failed for "DFID"\n", PFID(mdo2fid(obj)));
646                 RETURN(rc);
647         }
648         ma->ma_valid = MA_LOV;
649         
650         rc = mdd_unlink_log(env, mdd, obj, ma);
651         if (rc) {
652                 CWARN("mds unlink log for "DFID" failed: %d\n",
653                        PFID(mdo2fid(obj)), rc);
654                 RETURN(rc);
655         }
656         if (ma->ma_valid | MA_COOKIE)
657                 rc = mdd_lovobj_unlink(env, mdd, obj, la, 
658                                        ma->ma_lmm, ma->ma_lmm_size,
659                                        ma->ma_cookie, 1);
660         RETURN(rc);
661 }
662
663 int mdd_log_op_unlink(struct obd_device *obd,
664                       struct lov_mds_md *lmm, int lmm_size,
665                       struct llog_cookie *logcookies, int cookies_size)
666 {
667         struct mds_obd *mds = &obd->u.mds;
668         struct lov_stripe_md *lsm = NULL;
669         struct llog_unlink_rec *lur;
670         struct llog_ctxt *ctxt;
671         int rc;
672         ENTRY;
673
674         if (IS_ERR(mds->mds_osc_obd))
675                 RETURN(PTR_ERR(mds->mds_osc_obd));
676
677         rc = obd_unpackmd(mds->mds_osc_exp, &lsm, lmm, lmm_size);
678         if (rc < 0)
679                 RETURN(rc);
680         rc = obd_checkmd(mds->mds_osc_exp, obd->obd_self_export, lsm);
681         if (rc)
682                 GOTO(out, rc);
683         /* first prepare unlink log record */
684         OBD_ALLOC(lur, sizeof(*lur));
685         if (!lur)
686                 GOTO(out, rc = -ENOMEM);
687         lur->lur_hdr.lrh_len = lur->lur_tail.lrt_len = sizeof(*lur);
688         lur->lur_hdr.lrh_type = MDS_UNLINK_REC;
689
690         ctxt = llog_get_context(obd, LLOG_MDS_OST_ORIG_CTXT);
691         rc = llog_add(ctxt, &lur->lur_hdr, lsm, logcookies,
692                       cookies_size / sizeof(struct llog_cookie));
693         llog_ctxt_put(ctxt);
694
695         OBD_FREE(lur, sizeof(*lur));
696 out:
697         obd_free_memmd(mds->mds_osc_exp, &lsm);
698         RETURN(rc);
699 }
700
701 int mdd_unlink_log(const struct lu_env *env, struct mdd_device *mdd,
702                    struct mdd_object *mdd_cobj, struct md_attr *ma)
703 {
704         struct obd_device *obd = mdd2obd_dev(mdd);
705
706         LASSERT(ma->ma_valid & MA_LOV);
707
708         if ((ma->ma_cookie_size > 0) &&
709             (mdd_log_op_unlink(obd, ma->ma_lmm, ma->ma_lmm_size,
710                                ma->ma_cookie, ma->ma_cookie_size) > 0)) {
711                 ma->ma_valid |= MA_COOKIE;
712         }
713         return 0;
714 }
715
716 int mdd_log_op_setattr(struct obd_device *obd, __u32 uid, __u32 gid,
717                       struct lov_mds_md *lmm, int lmm_size,
718                       struct llog_cookie *logcookies, int cookies_size)
719 {
720         struct mds_obd *mds = &obd->u.mds;
721         struct lov_stripe_md *lsm = NULL;
722         struct llog_setattr_rec *lsr;
723         struct llog_ctxt *ctxt;
724         int rc;
725         ENTRY;
726
727         if (IS_ERR(mds->mds_osc_obd))
728                 RETURN(PTR_ERR(mds->mds_osc_obd));
729
730         rc = obd_unpackmd(mds->mds_osc_exp, &lsm, lmm, lmm_size);
731         if (rc < 0)
732                 RETURN(rc);
733
734         rc = obd_checkmd(mds->mds_osc_exp, obd->obd_self_export, lsm);
735         if (rc)
736                 GOTO(out, rc);
737
738         OBD_ALLOC(lsr, sizeof(*lsr));
739         if (!lsr)
740                 GOTO(out, rc = -ENOMEM);
741
742         /* prepare setattr log record */
743         lsr->lsr_hdr.lrh_len = lsr->lsr_tail.lrt_len = sizeof(*lsr);
744         lsr->lsr_hdr.lrh_type = MDS_SETATTR_REC;
745         lsr->lsr_uid = uid;
746         lsr->lsr_gid = gid;
747
748         /* write setattr log */
749         ctxt = llog_get_context(obd, LLOG_MDS_OST_ORIG_CTXT);
750         rc = llog_add(ctxt, &lsr->lsr_hdr, lsm, logcookies,
751                       cookies_size / sizeof(struct llog_cookie));
752
753         llog_ctxt_put(ctxt);
754
755         OBD_FREE(lsr, sizeof(*lsr));
756  out:
757         obd_free_memmd(mds->mds_osc_exp, &lsm);
758         RETURN(rc);
759 }
760
761 int mdd_setattr_log(const struct lu_env *env, struct mdd_device *mdd,
762                     const struct md_attr *ma,
763                     struct lov_mds_md *lmm, int lmm_size,
764                     struct llog_cookie *logcookies, int cookies_size)
765 {
766         struct obd_device *obd = mdd2obd_dev(mdd);
767
768         /* journal chown/chgrp in llog, just like unlink */
769         if (lmm_size > 0) {
770                 CDEBUG(D_INFO, "setattr llog for uid/gid=%lu/%lu\n",
771                         (unsigned long)ma->ma_attr.la_uid, 
772                         (unsigned long)ma->ma_attr.la_gid);
773                 return mdd_log_op_setattr(obd, ma->ma_attr.la_uid,
774                                           ma->ma_attr.la_gid, lmm, 
775                                           lmm_size, logcookies,
776                                           cookies_size);
777         } else
778                 return 0;
779 }
780
781 static int mdd_osc_setattr_async(struct obd_device *obd, __u32 uid, __u32 gid,
782                           struct lov_mds_md *lmm, int lmm_size,
783                           struct llog_cookie *logcookies, __u64 id, __u32 gen,
784                           struct obd_capa *oc)
785 {
786         struct mds_obd *mds = &obd->u.mds;
787         struct obd_trans_info oti = { 0 };
788         struct obd_info oinfo = { { { 0 } } };
789         int rc;
790         ENTRY;
791
792         if (OBD_FAIL_CHECK(OBD_FAIL_MDS_OST_SETATTR))
793                 RETURN(0);
794
795         /* first get memory EA */
796         OBDO_ALLOC(oinfo.oi_oa);
797         if (!oinfo.oi_oa)
798                 RETURN(-ENOMEM);
799
800         LASSERT(lmm);
801
802         rc = obd_unpackmd(mds->mds_osc_exp, &oinfo.oi_md, lmm, lmm_size);
803         if (rc < 0) {
804                 CERROR("Error unpack md %p for inode "LPU64"\n", lmm, id);
805                 GOTO(out, rc);
806         }
807
808         rc = obd_checkmd(mds->mds_osc_exp, obd->obd_self_export, oinfo.oi_md);
809         if (rc) {
810                 CERROR("Error revalidate lsm %p \n", oinfo.oi_md);
811                 GOTO(out, rc);
812         }
813
814         /* then fill oa */
815         oinfo.oi_oa->o_uid = uid;
816         oinfo.oi_oa->o_gid = gid;
817         oinfo.oi_oa->o_id = oinfo.oi_md->lsm_object_id;
818         oinfo.oi_oa->o_gr = oinfo.oi_md->lsm_object_gr;
819         oinfo.oi_oa->o_valid |= OBD_MD_FLID | OBD_MD_FLGROUP |
820                                 OBD_MD_FLUID | OBD_MD_FLGID;
821         if (logcookies) {
822                 oinfo.oi_oa->o_valid |= OBD_MD_FLCOOKIE;
823                 oti.oti_logcookies = logcookies;
824         }
825
826         oinfo.oi_oa->o_fid = id;
827         oinfo.oi_oa->o_generation = gen;
828         oinfo.oi_oa->o_valid |= OBD_MD_FLFID | OBD_MD_FLGENER;
829         oinfo.oi_capa = oc;
830
831         /* do async setattr from mds to ost not waiting for responses. */
832         rc = obd_setattr_async(mds->mds_osc_exp, &oinfo, &oti, NULL);
833         if (rc)
834                 CDEBUG(D_INODE, "mds to ost setattr objid 0x"LPX64
835                        " on ost error %d\n", oinfo.oi_md->lsm_object_id, rc);
836 out:
837         if (oinfo.oi_md)
838                 obd_free_memmd(mds->mds_osc_exp, &oinfo.oi_md);
839         OBDO_FREE(oinfo.oi_oa);
840         RETURN(rc);
841 }
842
843 int mdd_lov_setattr_async(const struct lu_env *env, struct mdd_object *obj,
844                           struct lov_mds_md *lmm, int lmm_size, 
845                           struct llog_cookie *logcookies)
846 {
847         struct mdd_device   *mdd = mdo2mdd(&obj->mod_obj);
848         struct obd_device   *obd = mdd2obd_dev(mdd);
849         struct lu_attr      *tmp_la = &mdd_env_info(env)->mti_la;
850         const struct lu_fid *fid = mdd_object_fid(obj);
851         struct obd_capa     *oc;
852         int rc = 0;
853         ENTRY;
854
855         mdd_read_lock(env, obj, MOR_TGT_CHILD);
856         rc = mdo_attr_get(env, obj, tmp_la, mdd_object_capa(env, obj));
857         mdd_read_unlock(env, obj);
858         if (rc)
859                 RETURN(rc);
860
861         oc = mdo_capa_get(env, obj, NULL, CAPA_OPC_MDS_DEFAULT);
862         if (IS_ERR(oc))
863                 oc = NULL;
864
865         rc = mdd_osc_setattr_async(obd, tmp_la->la_uid, tmp_la->la_gid, lmm,
866                                    lmm_size, logcookies, fid_seq(fid),
867                                    fid_oid(fid), oc);
868
869         capa_put(oc);
870
871         RETURN(rc);
872 }